亂碼

亂碼

The name of the picture

The name of the picture

The name of the picture

Clash Royale CLAN TAG#URR8PPP

網頁呈現亂碼現象
頁面：日文維基百科條目《書体》
對應於中文維基百科條目《字體》

乱码指的是電腦系統不能顯示正確的字符，而顯示其他無意義的字符或空白，如一堆ASCII代碼。这样所顯示出來的文字統稱為亂碼。^[1]

乱码是因为「所使用的字符的源码在本地计算机上使用了错误的显示字库」，或在本地计算机的字库中找不到相应于源码所指代的字符所致。不同国家和地区的文字字库采用了相同的一段源码，或是源文件中因为文件受到破坏，致使计算机默认提取的源码错误，或是计算机没有安装相应字库，都有可能产生乱码。

例如，微软编译器产生“烫烫烫”“屯屯屯”乱码，编码字符集转换产生的“锟斤拷”“毺絞銝”“脣銝餌”乱码。^[2]如果是台湾（BIG-5）会显示“昍昍昍”，日本（Shift-JIS）会显示“ﾌﾌﾌﾌﾌﾌ”。

目录

1 可能的產生原因

2 可能的解決方法

3 参見

4 参考

5 外部連結

可能的產生原因

一般是軟件程序解碼錯誤。如瀏覽器把GBK碼當成是Big5碼顯示，或電子郵件程序把對方傳來的郵件錯誤解碼。如果在發送時編碼錯誤，收件者的電郵程序是不能解碼的，需要寄件者的電郵程序重新編碼再寄。

字體檔案（font file）不對。

來源編碼錯誤，或文件受到破壞。

一种语言版本的操作系统安装了另外一种语言版本的应用程序，或者应用程序安装的补丁的语言版本与应用程序原来安装的语言版本不一致。

早期单字节的应用程序在打开双字节语言的文件时不能正确识别文字的分割，在换行的地方把一个字从中分成两段，导致紧接在后面的整个一行全部都是乱码。

低階版本的应用程序不能识别高階版本的程序创建的文件。

可能的解決方法

轉換編碼。一般可試Big5、GBK、UTF-8（Unicode的一種應用方式，包括世界上主要的文字）三種，如涉及的不是中文，可以再試JIS（日文）、KR（韓文）及其他文字編碼。徹底的解決方法是雙方使用同一編碼系統，如UTF-8，只要用戶有對應的字體檔案就可以正確的顯示文字。實際上要統一編碼系統還要克服各種客觀的困難，現時只有靠軟件（如Microsoft AppLocale）有更高的解碼能力。

轉換字體。如果解碼正確而出現錯誤文字，有可能是字體檔案中沒有相對應的字符，可嘗試轉換字體檔案。

如果本來該顯示出漢字的，卻變成數字，如最欣賞相中拉（最欣賞相中拉）等Unicode代碼，可以把這部分抄出來，獨立存儲成html檔，再用瀏覽器打開解碼。或可以直接使用JavaScript作解讀︰
```
alert("最欣賞相中拉");
```

其他。有時解碼的方法要視乎軟件和實際環境，及不斷嘗試才能解碼，特別在不知本來是用哪種編碼系統時。

有時輸入漢字時也會出現亂碼，不過這種情況很少出現。最大的原因是輸入法所用的編碼，與經編輯器輸出的字體編碼不符所致，可嘗試轉換字體來解決。例如把GBK編碼的輸入法裝到只支援Big5的系統上，是不能正確顯示所輸入的字的；必需選擇Big5編碼的輸入法，或把輸入法裝到GBK的系統中。

有關外文所引致的亂碼，只有轉換支援某外文的字體檔案才能解決。

参見

編碼（encode）

解碼（decode）

字體檔案（font file）

外字（UDC）

香港增補字符集（HKSCS）

中文亂碼

Microsoft AppLocale

参考

^ Schäfer, Ingo. Premodern Chinese Written Language, an Introduction. ^{[永久失效連結]}

^ 红猴子. "烫烫烫屯屯屯" 那些事. 知乎专栏

外部連結

邮件乱码

E-mail乱码解码器（简体中文）

E-mail乱码解码器（繁体中文）

E-mail乱码解码器

查论编字元編碼

字元集

早期电信	ASCII ISO/IEC 646 ISO/IEC 6937 T.61 sixbit code pages 博多碼摩斯電碼中文電碼

ISO/IEC 8859	-1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 -13 -14 -15 -16

书目使用	ANSEL ISO 5426 / 5426-2 / 5427 / 5428 / 6438 / 6861 / 6862 / 10585 / 10586 / 10754 / 11822 MARC-8

国家标准	ArmSCII CNS 11643 GOST 10859 GB 18030 HKSCS MSCS MISCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KPS 9566 KS X 1001 PASCII TIS-620 TSCII VISCII YUSCII

EUC	CN JP KR TW

ISO/IEC 2022	CN JP KR CCCII

MacOS代码页（“文字”）	阿拉伯语中欧简体中文 / EUC-CN 繁体中文 / Big5 克罗地亚语西里尔文梵文 Dingbats 波斯语希腊语古吉拉特语古木基文希伯来语冰岛文日文 / ShiftJIS 韩文 / EUC-KR 罗马文罗马尼亚语符号泰文 / TIS-620 土耳其语乌克兰文

DOS代码页	437 720 737 775 850 852 855 857 858 860 861 862 863 864 865 866 869 Kamenický Mazovia MIK Iran System

Windows代码页	874 / TIS-620 932 / ShiftJIS 936 / GBK 949 / EUC-KR 950 / Big5 1250 1251 1252 1253 1254 1255 1256 1257 1258 1361 54936

EBCDIC代码页	37/1140 273/1141 277/1142 278/1143 280/1144 284/1145 285/1146 297/1147 420/16804 424/12712 500/1148 838/1160 871/1149 875/9067 930/1390 933/1364 937/1371 935/1388 939/1399 1025/1154 1026/1155 1047/924 1112/1156 1122/1157 1123/1158 1130/1164 JEF KEIS

特定平台	ATASCII CDC display code DEC-MCS DEC Radix-50 Fieldata GSM 03.38 HP roman8 PETSCII TI calculator character sets WISCII ZX Spectrum character set

Unicode / ISO/IEC 10646	UTF-8 UTF-16/UCS-2 UTF-32/UCS-4 UTF-7 UTF-1 UTF-EBCDIC GB 18030 SCSU BOCU-1

杂项代码页	APL Cork HZ IBM code page 1133 KOI8 TRON

相关主题	控制字符 (C0 C1) CCSID HTML字符编码字符集探测中日韩统一表意文字 ISO 6429/IEC 6429/ANSI X3.64 乱码