区位码和国际码的转换, 点阵存储

某汉字的区位码是3721,它的国际码是
   A)5445H    B)4535H   C)6554H    D)3555H
 
国际码=区位码+2020H。即将区位码的十进制区号和位号分别转换成十六进制数,然后分别加上20H,就成了汉字的国际码。
 
1.区位码:37 21(十进制)-->25 15(十六进制)
2.国标码:高位(区位码)+20H 低位(区位码)+20
  国标码:25+20 15+20-->4535H
3.答案:B

由于一个字节只能表示256种编码,显然一个字节不能表示汉字的国际码,所以一个国际码必须用两个字节表示。

机器语言和汇编语言都是"低级"的语言,而高级语言是一种用表达各种意义的"词"和"数学公式"按照一定的语法规则编写程序的语言,其中比较具有代表性的语言有FORTRAN,C,C++等。

汇编语言虽然在编写、修改和阅读程序等方面有了相当的改进,但仍然与人们的要求有一定的距离,仍然是一种依赖于机器的语言。

1.机内码与区位码
机内码高位字节=(区号)H+A0H
机内码低位字节=(位号)H+A0H
2.国标码与区位码
国标码高位字节=(区号)H+20H
国标码低位字节=(位号)H+20H
3.区位码用两个10进制数表示,另外两种码用两个十六进制数表示.
4."德"的区位码为2134,下面举例来看如何转成另外两种码:
  a.机内码
    高位字节=(21)(十进制)+A0H(十六进制)=15H+A0H=B5H
    低位字节=(34)(十进制)+A0H(十六进制)=22H+A0H=C2H
    所以,机内码为B5C2
  b.国标码
    高位字节=(21)(十进制)+20H(十六进制)=15H+20H=35H
    低位字节=(34)(十进制)+20H(十六进制)=22H+20H=42H
    所以,国标码为3542 

点阵法(字模点阵码):每一个汉字以点阵形式存储在记录介质上,有点的地方为“1”,空白的地方为“0”。
  16*16点阵:16*16/8=32字节 
  24*24点阵:24*24/8=72字节 
  32*32点阵:32*32/8=128字节

---------------------------
小常识

1. 国家标准汉字代码体系   汉字字数繁多,属性丰富,因而汉字代码体系也较复杂,包括: 
  (1)汉字机内码。它们是汉字在计算机汉字系统内部的表示方法,是计算机汉字系统 的基础代码。 
  (2)汉字交换码。它们是国标汉字(如机内码)进行信息交换的代码标准。 
  (3)汉字输入码。它们是在计算机标准键盘上输入汉字用到的各种代码体系。  
  (4)汉字点阵码。它们是在计算机屏幕上显示和在打印机上打印输出汉字的代码体系。 
  (5)汉字字形控制码。为了打印各种风格的字体和字形所制定的代码。   这些代码系统有的必须有统一的国家标准,有的则不要求统一。近年来我国已经制定 系列汉字信息处理方面的国家标准,今后将继续完善,并与国际上求得统一。  

2. 国家标准汉字交换码((((国标码国标码国标码国标码))))   我国制定了“中华人民共和国国家标准信息交换汉字编码”,标准代号为GB2312—80, 这种编码又称为国标码。
    在国标码的字符集中共收录了一级汉字3755个,二级汉字3008 个,图形符号682个,三项字符总计7445个。 
    国标码是指1980年中国制定的用于不同的具有汉字处理功能的计算机系统间交换汉字信息时使用的编码。
    国际码是二字节码, 用两个七位二进制数编码表示一个汉字。
    目前国标码收入6763个汉字, 其中一级汉字(最常用)3755个, 二级汉字3008个, 另外还包括682个西文字符、图符。
    一级汉字为常用字,按拼音顺序排列,二级汉字为次常用字,按部首排列。国标码的范围是2121H—7E7EH。 

3、区位码区位码区位码区位码:
     国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码  
    在国标GB2312—80中规定,所有的国标汉字及符号分配在一个94行、94列的方阵中, 方阵的每一行称为一个“区”,编号为01区到94区,每一列称为一个“位”,编号为01 位到94位,方阵中的每一个汉字和符号所在的区号和位号组合在一起形成的四个阿拉伯 数字就是它们的“区位码”。

    区位码的前两位是它的区号,后两位是它的位号。用区位码 就可以唯一地确定一个汉字或符号,反过来说,任何一个汉字或符号也都对应着一个唯一 的区位码。汉字“母”字的区位码是3624,表明它在方阵的36区24位,问号“?”的区 位码为0331,则它在03区3l位。   
    所有的汉字和符号所在的区分为以下四个组:    
    (1)01区到15区。图形符号区,其中01区到09区为标准符号区,10区到15区为 自定义符号区。   01区到09区的具体内容如下;   1)01区。一般符号202个,如间隔符、标点、运算符、单位符号及制表符;   2)02区。序号60个,如1.~20.、(1)~(20)、①~⑩及(一)~(十);   3)03区。数字22个,如0—9及X一XII,英文字母52个,其中大写A—Z、小写 a—z各26个;   4)04区。日文平假名83个;   5)05区。日文片假名86个;   6)06区。希腊字母48个;   7)07区。俄文字母66个; 
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页