Ⅰ 在计算机中,一个汉字的国标码(交换码)、区位码、机内码、字形码各占多少字节
机内码
计算机系统中用来表示中文或西文信息的代码称为机内码。ASCII码是一种西文机内码。汉字机内码不能用国标码代替,否则会和ASCll码相冲突。
基本定义
计算机系统中用来表示中文或西文信息的代码称为机内码。ASCII码是一种西文机内码。汉字机内码不能用国标码代替,否则会和ASCll码相冲突。虽然汉字机内码也用连续的两个字节表示,但它每个字节的最高位是1。汉字机内码与国标区位码的关系为:
汉字机内码高位字节=国标区位码高位字节+80H(H表示十六进制)
汉字机内码低位字节=国标区位码低位字节+80H
例如,“文”的汉字输入法的区位码为4636,它的区码和位码分别用十六进制表示即为“2E24H”,转换成国标码就是“4E44H”,它的机内码为“CEC4H”,其中CEH为机内码的高位字节,C4H为机内码的低位字节。
主要内容
机内码
输入码、区位码、国标码与机内码
国家标准局1980年颁布的《信息交换用汉字编码字符集"基本集》(代号为GB2312 80)规定的汉字交换码作为国家标准汉字编码。 GB2312 80中共有7445个字符符号: 汉字符号6763个 一级汉字3755个(按汉语拼音字母顺序排列) 二级汉字3008个(按部首笔划顺序排列) 非汉字符号682个 GB2312 80规定,我们知道,键盘是当前微机的主要输入设备,;输入码就是使用英文键盘输入汉字时的编码。目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码、音码、形码、音形码四类,如“保”字,用全拼,输入码为码为“BAO”,用区位码,输入码为“1703”,用五笔字型则为“WKS”。
计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。 汉字交换码(国标码)主要用于汉字信息交换,我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个
Ⅱ .根据汉字国标码GB2312—80,存储一个汉字的机内码需用()字节
一个汉字或标点符号占一个字节的空间,1024字节等于1k,1024k等于1m,1024m等于1g。那么500g的硬盘存储的汉字理论上应该等于1✘1024✘1024✘1024✘500=536870912000字。
Ⅲ 汉字国标码用几个字节
汉字国标码用2个字节的存储空间
Ⅳ 国标码存储一个汉字所需要的存储空间是多少
一个中文汉字占两个字节的空间,一个汉字中的标点也是两个字节。
计算机信息技术用于计量存储容量的一种计量单位,通常情况下一字节等于八位,也在一些计算机编程语言中表示数据类型和语言字符。
一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制,最小值-128,最大值127。如一个ASCII码就是一个字节。
数据存储是以“字节”(Byte)为单位,数据传输大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。
B与iB:
1KiB(Kibibyte)=1024byte
1KB(Kilobyte)=1000byte
1MiB(Mebibyte)=1048576byte
1MB(Megabyte)=1000000byte
Ⅳ 通常一个汉字的国标码需要几个字节来存放
GB2312编码是2个字节,UTF-8是3个字节。
Ⅵ 一个汉字的国标码需用2个字节存储,其每个字节的最高二进制位的值分别为
如果是一个汉字的内码需用2个字节存储,其每个字节的最高二进制位的值就为1.1。
国标码是汉字编码的标准,而不是存储的标准。就国标码的编码而言,其前后字节的最高位均为0。
汉字的存储,使用的是机内码。国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,因此机内码前后字节最高位都为1。
(6)国标码各占用存储字节扩展阅读:
因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。
国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即
汉字机内码=汉字国标码+8080H
例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。
汉字机内码的基础是汉字国标码。
Ⅶ 通常情况下,用国标码表示的23个常用汉字在计算机中占()字节
b c a a
Ⅷ 国标码规定,一个汉字用两个字节表示,每字节用______位。
中国字比较复杂,1字节=8位,8位从0000
0000到1111
1111只能表示256个字符,2个字节是2*8=16位,从0000
0000
0000
0000到1111
1111
1111
1111可以表示65535个字符。
6万多个足以表示我们经常用的那些字了。所以我们用2字节表示汉字。如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。
Ⅸ 国标码每个汉字多少字节
国标码每个汉字2个字节,也就是16位二进制存储空间。