汉字编码是什么?

汉字编码是什么?

汉字编码是什么?

文章插图
计算机中汉字的表示也是用二进制编码,同样是人为编码的 。根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码 。
1.外码(输入码)外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号 。
常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择 。2.交换码(国标码)计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外 。而二进制代码使用起来是不方便的,于是需要采用信息交换码 。中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码 。
区位码是国标码的另一种表现形式,把国标GB2312--80中的汉字、图形符号组成一个94×94的方阵,分为94个“区”,每区包含94个“位”,其中“区”的序号由01至94,“位”的序号也是从01至94 。94个区中位置总数=94×94=8836个,其中7445个汉字和图形字符中的每一个占一个位置后,还剩下1391个空位,这1391个位置空下来保留备用 。3.机内码根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码 。
4.汉字的字形码字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中 。通常用16×16点阵来显示汉字 。5.汉字地址码汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码 。
它与汉字内码有着简单的对应关系,以简化内码到地址码的转换 。4 五种类型 编辑据粗略统计,现有400多种编码方案,其中上机通过试验的和已被采用作为输入方式的也有数十种之多 。归纳起来,不外5种类型:①整字输入法:前一阶段,一般是将三四千个常用汉字排列在一个具有三四百个键位的大键盘上 。
大多是将这些汉字按XY坐标排列在一张字表上,通常叫“字表法”,或“笔触字表法” 。比如,X25行和Y90列交叉的字为“国”,当电笔点到字表上的“国”字时,机器自动将该字的代码2590输入 。键盘上或字表中字按部首或按音序或按字义联想而排列 。不常用的字作为盘外字或表外字,另行编码处理 。
②字形分解法:将汉字的形体分解成笔画或部件,按一定顺序输进机器 。笔画一般分成8种:横一、竖(丨)、撇(丿)、点(丶)、折(□)、弯(□)、叉十、方(口) 。部件一般归纳出一二百个 。由于一般键盘上只有42个键(包括数字和标点),容纳不下这么多部件,因而有人设计中键盘,也有人利用部件形体上的相似点或出现概率的不同,而把100多个部件分布在26个字母键上 。
什么是汉字编码?
汉字编码是什么?

文章插图
每天,我们都窝在格子间里噼里啪啦敲代码敲到脱发,对代码我们是再熟悉不过的老朋友了 。但不知道小伙伴们有没有想过这样一个问题:那些让我们“英年早秃”的代码,到底是怎么来的呢?今天,丽斯老师就带大家看看,这个让我们爱恨两难的“老朋友”究竟是何方神圣 。
什么是编码?编码,是信息从一种形式或格式转换为另一种形式的过程,简单来讲就是语言的翻译过程 。
我们都知道计算机使用的是机器语言即二进制码,相信大部分人都无法流畅的阅读二进制码 。于是为了能够让人类更好的理解计算机输出的结果就需要将机器语言转换为自然语言 。比如英语、俄语和中文等 。这看似简单的语言转换过程,随着计算机的普及,与互联网化对语言字符的编码冲击也越来越大 。
编码规范的调整也伴随着整个计算机发展历史在逐步完善,甚至“愈演愈烈” 。现代编码模型为了能够更精确的描述在编码过程中各个产物的归属以便正确的描述产物所发挥的功能 。于是多事之人将现代的编码整理为一套可以说明的模型而且分为五层之多 。
现代编码模型之分层:抽象字符表(ACR:Abstract character repert-oire)是一个系统支持的所有抽象字符的集合 。简单来说就是该层规范要确定一个系统能够包含的字符和字符形式 。比如Windows支持中文,那么它的抽象字符表一定有中文字符集合而且也适配不同编码方式指定具体是何字符 。