文字化け,发音为/modʑibake/)是计算机软件不能正确显示文字时,所显示的不正确、不可读的字符的名称。在使用计算机时,文本是用字符编码的。在传输中,每个字符都被它在编码中的位置(或数字)所取代。为了再次显示该字符,该位置再次被该字符取代。当没有指定原始编码时,当数字再次被替换为显示的字符时,可能会使用一个不同的字符。Unicode的出现就是为了解决这个问题:UTF-8能够对大多数常见的字符进行2个字节的编码。
在Unicode被引入之前,其他的字符编码被使用。举例来说,ISO-8859包含15种不同的编码。这些都是英语中常用的字符。它们有几个 "块 "的 "特殊字符",每个编码的归档方式不同。


