当前位置:首页 » 服务存储 » 用2个存储单元怎么表示机内码
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

用2个存储单元怎么表示机内码

发布时间: 2022-05-20 03:45:01

1. 什么是计算机的机内码

汉字的机内码是计算机系统内部对汉字进行存储、处理、传输统一使用的代码,又称为汉字内码。由于汉字数量多,一般用2个字节来存放汉字的内码。在计算机内汉字字符必须与英文字符区别开来,以免造成混乱。汉字机内码中两个字节的最高位均置1。

2. 机内码、国际码、区位码之间如何换算

一般换算全部用十六进制。机内码、国际码是十六进制的,区位码是十进制的。具体换算步骤:(H表示十六进制,D表示十进制)

1、将四位数的区位码分为两部分,两位数一组。

2、将这两个两位数换算为十六进制,运用公式进行计算。

国际码=区位码(十六进制)+2020H

机内码=国际码+8080H

例如:某汉字的区位码是2534。则25D=19H,34D=22H

则国际码=1922H+2020H=3952H,机内码=3952H+8080H=B9D2H

(2)用2个存储单元怎么表示机内码扩展阅读

区位码、国标码与机内码都是汉字的编码形式,它们之间有着千丝万缕的联系,但其间的区别也是不容忽视的。

国标码是基础,指国家标准汉字编码。即《信息交换用汉字编码字符集(基本集)》,简称GB-2312。该字符集有汉字6763个。设有94个区,每个区94个位。每个汉字有一个固定的区位。

区位码与国标码的区别在于,在GB-2312中预留了一些空位,便于补充和扩展,经过扩展的区位码字符数量及范围就超过了GB-2312。而且台湾、香港、及日韩也是用区位码的,但其区位号与大陆用的就完全不相同。

机内码是为了避免ASCII码和国标码同时使用时产生两义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。

3. 机内码的符号是怎么样的

计算机中信息的编码
在计算机中,各种信息都是以二进制编码的形式存在的;也就是说,不管是文字、图形、声音、动画,还是电影等各种信息,在计算机中都是以0和1组成的二进制代码表示的;计算机之所以能区别这些信息的不同,是因为它们采用的编码规则不同。比如:同样是文字,英文字母与汉字的编码规则就不同,英文字母用的是单字节的ASCII码,汉字采用的是双字节的汉字内码;但随着需求的变化,这两种编码有被统一的UNICODE码(由Unicode 协会开发的能表示几乎世界上所有书写语言的字符编码标准)所取代的趋势;当然图形、声音等的编码就更复杂多样了。这也就告诉我们,信息在计算机中的二进制编码是一个不断发展的、高深的、跨学科的知识领域。
1、字符(英文,包括字母、数字、标点、运算符等)编码
字符的编码采用国际通用的ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码),每个ASCII码以1个字节(Byte)储存,从0到数字127代表不同的常用符号,例如大写A的ASCII码是65,小写a则是97。由于ASCII码只用了字节的七个位,最高位并不使用,所以后来又将最高的一个位也编入这套编码码中,成为八个位的延伸ASCII(ExtendedASCII)码,这套内码加上了许多外文和表格等特殊符号,成为目前常用的编码。基本的ASCII字符集共有128个字符,其中有96个可打印字符,包括常用的字母、数字、标点符号等,另外还有32个控制字符。标准ASCII码使用7个二进位对字符进行编码,对应的ISO标准为ISO646标准。下表展示了基本ASCII字符集及其编码:
字母和数字的ASCII码的记忆是非常简单的。我们只要记住了一个字母或数字的ASCII码(例如记住A为65,0的ASCII码为48),知道相应的大小写字母之间差32,就可以推算出其余字母、数字的ASCII码。
虽然标准ASCII码是7位编码,但由于计算机基本处理单位为字节(1byte = 8bit),所以一般仍以一个字节来存放一个ASCII字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为0(在数据传输时可用作奇偶校验位)。由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO2022标准,它规定了在保持与ISO646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每种扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(即十进制数128~255),称为扩展ASCII码。下表展示的是最流行的一套扩展ASCII字符集和编码:
2、汉字的编码
(1)汉字内码
汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集——基本集》,即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态。由于ASCII码的34个控制代码在汉字系统中也要使用,为不致发生冲突,不能作为汉字编码,128除去34只剩94种,所以汉字编码表的大小是94×94=8836,用以表示国标码规定的7445个汉字和图形符号。
每个汉字或图形符号分别用两位的十进制区码(行码)和两位的十进制位码(列码)表示,不足的地方补0,组合起来就是区位码。把区位码按一定的规则转换成的二进制代码叫做信息交换码(简称国标码)。国标码共有汉字6763个(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共3755个;二级汉字,属于次常用汉字,按偏旁部首的笔划顺序排列,共3008个),数字、字母、符号等682个,共7445个。
由于国标码不能直接存储在计算机内,为方便计算机内部处理和存储汉字,又区别于ASCII码,将国标码中的每个字节在最高位改设为1,这样就形成了在计算机内部用来进行汉字的存储、运算的编码叫机内码(或汉字内码,或内码)。内码既与国标码有简单的对应关系,易于转换,又与ASCII码有明显的区别,且有统一的标准(内码是惟一的)。

(2)汉字外码
无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉字编码,称为汉字输入码。汉字输入码属于外码。不同的输入方法,形成了不同的汉字外码。常见的输入法有以下几类:
按汉字的排列顺序形成的编码(流水码):如区位码;
按汉字的读音形成的编码(音码):如全拼、简拼、双拼等;
按汉字的字形形成的编码(形码):如五笔字型、郑码等;
按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC。
输入码在计算机中必须转换成机内码,才能进行存储和处理。

(3)汉字字形码
为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。
全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库以文件的形式存放在硬盘上,现多用这种方式,硬字库则将字库固化在一个单独的存储芯片中,再和其它必要的器件组成接口卡,插接在计算机上,通常称为汉卡。
用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。例:用16×16点阵表示一个汉字,就是将每个汉字用16行,每行16个点表示,一个点需要1位二进制代码,16个点需用16位二进制代码(即2个字节),共16行,所以需要16行×2字节/行=32字节,即16×16点阵表示一个汉字,字形码需用32字节。
即:字节数=点阵行数×点阵列数/8
用于打印的字库叫打印字库,其中的汉字比显示字库多,而且工作时也不像显示字库需调入内存。
可以这样理解,为在计算机内表示汉字而统一的编码方式形成汉字编码叫内码(如国标码),内码是惟一的。为方便汉字输入而形成的汉字编码为输入码,属于汉字的外码,输入码因编码方式不同而不同,是多种多样的。为显示和打印输出汉字而形成的汉字编码为字形码,计算机通过汉字内码在字模库中找出汉字的字形码,实现其转换。

4. 省级计算机试题“以下是用十六进制表示的两个连续的存储单元”其中 () 一定不是汉字编码。

按照汉字在计算机中处理过程的不同,汉字编码可以分汉字输入码(外码),汉字机内码(内码)和汉字字模码(字型码)。
1、汉字输入时:汉字输入码(外码),如区位码,拼音码,五笔字型码。
其中只有区位码没有重码。由区码和位码组成,其十进制编码范围为:0101~9494,即十六进制编码范围为0101H~5E5EH。(有关区位码的详细情况,如果有兴趣,请在网上查询相关资料。)
2、汉字存储、检索、传输时:汉字机内码,其编码是将国际码每个字节最高位设为1,以避免与ASCII码相冲突,而国际码的编码可由区位码+2020H得到,即国际码编码范围为:2121H~7F7FH;也就是说二进制编码范围为:0010000100100001~0111111101111111。机内码就是将国际码每个字节最高位置为1,其范围为:1010000110100001~1111111111111111,十六进制范围为:A1A1H~FFFFH
3、汉字显示、打印输入时:汉字字模码,其编码是用来表达字符的点阵信息的。题目中给出的四个选项的编码,每个只有2个字节,无法有效构成汉字点阵。
综上所述:答案应为A。

5. 机内码的表示

16位

6. 机内码,输入码,处理码,字形码,区位码的定义

机内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。

输入码是指用户从键盘上键入汉字时所使用的汉字编码。如输入码:区位码等,拼音编码:全拼、双拼、自然码等,字形编码:五笔、表形码等。

处理码是英文信息处理的标准编码,是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

字形码是点阵代码的一种。是为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,得到的相应的点阵代码。

区位码是一个四位的十进制数,每个区位码都对应着一个唯一的汉字或符号,它的前两位叫做区码,后两位叫做位码。

(6)用2个存储单元怎么表示机内码扩展阅读:

由于历史、地区原因,有时一种文字会出现多种编码方案,特别是汉字。由于不同于系统内码的字符不能在该系统中正常显示,必须要进行字符的内码转换,即将非系统内码的字符转换为系统可以识别的内码字符。

在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列), 在区位码汉字输入方法中,汉字编码无重码。

在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等。

7. 4kb的存储容量可以存放几个用机内码表示的汉字为什么

4kb可以存放2048个汉字。
4kb就是4096个字节,而汉字机内码用两个字节表示,所以就是2048个汉字。

8. 一个汉字的机内码需用几个字节存储

一个汉字的机内码需用2个字节存储。

我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示。

原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。

这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。

(8)用2个存储单元怎么表示机内码扩展阅读:

机内码的相关规定:

国家标准局颁布的《信息交换用汉字编码字符集基本集》(代号为GB2312-80)规定的汉字交换码作为国家标准汉字编码。

GB2312-80中共有7445个字符符号:汉字符号6763个一级汉字3755个(按汉语拼音字母顺序排列)二级汉字3008个(按部首笔划顺序排列)非汉字符号682个GB2312-80规定,键盘是当前微机的主要输入设备,输入码就是使用英文键盘输入汉字时的编码。

目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码、音码、形码、音形码四类,如“保”字,用全拼,输入码为“BAO”,用区位码,输入码为“1703”,用五笔字型则为“WKS”。

参考资料来源:网络-机内码

9. 一个汉字的国标码需用2个字节存储,其每个字节的最高二进制位的值分别为

如果是一个汉字的内码需用2个字节存储,其每个字节的最高二进制位的值就为1.1。

国标码是汉字编码的标准,而不是存储的标准。就国标码的编码而言,其前后字节的最高位均为0。

汉字的存储,使用的是机内码。国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,因此机内码前后字节最高位都为1。

(9)用2个存储单元怎么表示机内码扩展阅读:

因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。

国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即

汉字机内码=汉字国标码+8080H

例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。

汉字机内码的基础是汉字国标码。

10. 2KB的内存能存储( )个汉字的机内码

一个汉字是2字节,2KB是2048字节,所以可能存储1024个。

汉字机内码在计算机内的存储的描述是,其使用二个字节存储,每个字节最高位一位为1。计算机中, 补码第一位是符号位, 1 表示为负数,所以 汉字机内码的每个字节表示的十进制数都是负数。

(10)用2个存储单元怎么表示机内码扩展阅读:

汉字机内码的换算:

1KB=1024B;1MB=1024KB=1024×1024B。其中1024=2 10。

1B(byte,字节)= 8 bit(见下文)。

1KB(Kibibyte,千字节)=1024B= 2^10 B。

1 MB(Mebibyte, 兆字节,百万字节,简称“兆”)=1024KB= 2^20 B。

1 GB(Gigabyte, 吉字节,十亿字节,又称“千兆”)=1024MB= 2^30 B。

1 TB(Terabyte,万亿字节,太字节)=1024GB= 2^40 B。

1 PB(Petabyte,千万亿字节, 拍字节)=1024TB= 2^50 B。

1 EB(Exabyte,百亿亿字节, 艾字节)=1024PB= 2^60 B。

1 ZB(Zettabyte,十万亿亿字节,泽字节)= 1024EB= 2^70 B。

1 YB(Yottabyte,一亿亿亿字节, 尧字节)= 1024ZB= 2^80 B。

1 BB(Brontobyte,一千亿亿亿字节)= 1024YB= 2^90 B。

1NB(NonaByte,一百万亿亿亿字节) = 1024 BB = 2^100 B。

1DB(DoggaByte,十亿亿亿亿字节) = 1024 NB = 2^110 B。