華語網(wǎng)_語文知識_初中語文_小學(xué)語文_教案試題_中考高考作文

首頁 > 中華文化 > 中國歷史

計算機漢字編碼簡介

[移動版] 作者:佚名

計算機漢字編碼簡介

為進行信息交換,各漢字使用地區(qū)都制訂了一系列漢字字符集標(biāo)準(zhǔn)。

① GB2313字符集,收入漢字6763個,符號715個,總計7478個字符,這是大陸普遍使用的簡體字符集?w-GB2313、仿宋-GB2313、華文行楷等市面上絕大多數(shù)字體支持顯示這個字符集,亦是大多數(shù)輸入法所采用的字符集。市面上絕大多數(shù)所謂的繁體字體,其實采用的是GB-2313字符集簡體字的編碼,用字體顯示為繁體字,而不是直接用GBK字符集中繁體字的編碼,錯誤百出。

② BIG-5字符集,收入13060個繁體漢字,808個符號,總計13868個字符,目前普遍使用于臺灣、香港等地區(qū)。臺灣教育部標(biāo)準(zhǔn)宋體楷體等港臺大多數(shù)字體支持這個字符集的顯示。

③ GBK字符集,又稱大字符集(GB=GuóBiāo國標(biāo),K=擴展),包含以上兩種字符集漢字,收入21003個漢字,882個符號,共計21885個字符,包括了中日韓(CJK)統(tǒng)一漢字20902個、擴展A集(CJK Ext-A) 中的漢字52個。Windows 9598簡體中文版就帶有這個GBK.txt文件。宋體、隸書、黑體、幼圓、華文中宋、華文細(xì)黑、華文楷體、標(biāo)楷體(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字體支持顯示這個字符集。微軟拼音輸入法2003、全拼、紫光拼音等輸入法,能夠錄入如镕镕炁夬喆嚞姤赟赟?龑昳堃慜靕臹等GBK簡繁體漢字。

BIG-5 (繁體中文)與GB-2313 (簡體中文),編碼不相兼容,字符在不同的操作系統(tǒng)中便產(chǎn)生亂碼。文本文字的簡體與繁體(文字及編碼)之間的轉(zhuǎn)換,可用BabelPad、TextPro或Convertz之類的轉(zhuǎn)碼軟件來解決。若是程序,Windows XP操作系統(tǒng),可用Microsoft AppLocale Utility 1.0解決;Windows 2000的操作系統(tǒng),大概只有用:中文之星、四通利方、南極星、金山快譯之類的轉(zhuǎn)碼軟件方能解決了。

④ GB18030字符集,包含GBK字符集、CJK Ext-A 全部6582個漢字,共計27533個漢字。宋體-18030、方正楷體(FZKai-Z03)、書同文楷體(MS Song)宋體(ht_cjk+)、香港華康標(biāo)準(zhǔn)宋體(DFSongStd)、華康香港標(biāo)準(zhǔn)楷體、CERG Chinese Font、韓國New Gulim,以及微軟Windows Vista操作系統(tǒng)提供的宋黑楷仿宋等字體亦支持這個字符集的顯示。Windows 98支持這個字符集,以下的字符集則不支持。手寫輸入法逍遙筆4.0版支持GB18030字符集及方正超大字符集漢字的錄入。

⑤ 方正超大字符集,包含GB18030字符集、CJK Ext-B中的36862個漢字,共計64395個漢字。宋體-方正超大字符集支持這個字符集的顯示。Microsoft Office XP或2003簡體中文版就自帶有這個字體。Windows 2000的操作系統(tǒng)需安裝超大字符集支持包“Surrogate更新”。

⑥ ISO/IEC 10646 / Unicode字符集,這是全球可以共享的編碼字符集,兩者相互兼融,涵蓋了世界上主要語文的字符,其中包括簡繁體漢字,計有:CJK統(tǒng)一漢字20902個,CJK Ext-A 6582個,Ext-B 42711個,共計70195個漢字。SimSun-ExtB(宋體)、MingLiU-ExtB(細(xì)明體)能顯示全部Ext-B漢字。至今尚無單獨一款字體能夠顯示全部70195個漢字,但可用海峰五筆、新概念五筆、倉頡輸入法世紀(jì)版、新版的微軟新注音、倉頡輸入法 6.0 版(單碼功能)等輸入法錄入。Ext-C還有2萬多個漢字。詳情請參閱香港中文大學(xué)網(wǎng)站、馬來西亞倉頡之友網(wǎng)站、福建陳清鈺個人網(wǎng)站。

⑦ 漢字構(gòu)形數(shù)據(jù)庫2.3版,內(nèi)含楷書字形60082個、小篆11100個、楚系簡帛文字2627個、金文3459個、甲骨文177個、異體字12768組?梢园惭b該程序,亦可以解壓后使用其中的字體文件,對于整理某些古代文獻十分有用。

如果超出了輸入法所支持的字符集,就不能錄入計算機。如果沒有相應(yīng)字體的支持,則顯示為黑框、方框或空白。如果操作系統(tǒng)或應(yīng)用軟件不支持該字符集,則顯示為問號(一個或兩個)。在網(wǎng)頁上亦存在同樣的情況。

查看更多漢字 計算機 編碼資料
隨機推薦