什麼是ANSI 字元集?概念、運作方式
網絡百科全書中ANSI字元集的定義。
什麼是 ANSI 字元集?
ANSI 字元集,也稱為 Windows 字碼頁,是 Microsoft Windows 95 和 Windows 98 使用的 8 位元字元集,可讓您表示最多 256 個字元 (編號為 0 到 255)。
ASCII (美國資訊交換標準代碼) 字元集是 ANSI (美國國家標準協會) 字元集的子集,其字元編號為 32 到 126,每個字元代表一個可顯示的字元。某些 ANSI 字元代碼無法由 Windows 95 或 Windows 98 應用程式顯示,而且通常會在輸出裝置上顯示為實心區塊。
ANSI 字元集表
ANSI 會使用單一位元組來表示字元,這與 Windows NT 支援的 Unicode 標準相反,後者會使用 2 個位元組來表示字元。例如,ANSI 字元 «A» 會以十六進位表示法以單一位元組 41h 表示。ANSI 的 256 個字元限制僅支援少數國際字元,例如重音法語和德語元音,但 Unicode 的 65,536 個字元限制幾乎支援世界上所有字母表。例如,Unicode 字元 «A» 會以十六進位表示法以兩位元組字串 {41h, 00h} 表示。
ANSI 字元集的歷史記錄 (Windows 字碼頁)
最初,計算機系統和系統編程語言沒有區分字符和字節。這導致了隨後的許多混亂。Windows NT 系列之前的 Microsoft 軟件和系統就是這方面的例子,使用 OEM 和 ANSI 代碼頁,它們沒有區分。
自 1990 年代後期以來,軟體和系統越來越多地採用更直接的 Unicode 編碼,特別是 UTF-8 和 UTF-16;XML 的廣泛採用改善了這一趨勢,它提供了更適當的機制來標記所使用的編碼。最近的 Microsoft 產品和應用程式介面在內部使用 Unicode,但許多應用程式和 API 在讀取和寫入檔案或標準輸出的文字資料時,繼續使用電腦地區設定的預設編碼。因此,儘管 Unicode 是公認的標準,但仍與較舊的 Windows 字碼頁向後相容。
歐洲符號是在引入許多 ANSI 和 OEM 代碼頁之後引入的;幾個代碼頁被修改為包含歐洲符號。
從 1803 版開始,Windows 機器可以設定為允許 UTF-8 作為「ANSI」和 OEM 字碼頁。