当前位置:首页 » 服务存储 » 汉字在电脑存储方式
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

汉字在电脑存储方式

发布时间: 2022-09-23 07:54:15

A. 计算机中如何存储中文汉字信息

首先计算机存储的是1和0,而对应ASCII码,每个字母或部分符号对应了一个8位的2进制数,查表即可得一个字母或符号
计算机中汉字编码一般采用两个高位(左边第一位)为1
的ASCⅡ码表示一个汉字。即用两个字节表示一个汉字。
汉字在计算机内的编码很复杂,涉及汉字的各种代码,如汉字输入码,汉字机内码,汉字交换码,汉字字形码等。

B. 汉字信息在计算机中通常是以______形式存储的

计算机内部用于汉字信息的存储、运算的信息代码称为汉字内码。

汉字内码指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

(2)汉字在电脑存储方式扩展阅读:

汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1。

即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。

C. 在各种计算机语言中汉字以什么形式存在

汉字一般是以图形方式(点阵或者矢量等)储存在字库里,系统或者应用程序调用的时候用汉字编码就可以了。C语言也是一样。也有个别的软件,例如早期的游戏会自己制作一个小字库,里面只有自己需要的那些字就够了。如果没有中文环境,使用汉字的程序会无法显示,一般显示为乱码,也就是汉字本身不是直接保存在C程序里的。
说的糊里糊涂,可能有不对的地方,原理上应该是那样的。
是指用C程序打开文件,类似记事本那种查找插入功能?这有专门的排序,查找位置的方法。还要看文件的存储形式。你多了解一些就会了。比如从怎么建立一个文件开始.
当初学过的一点C语言早就忘光了。只能建议你去找点turbo
c的教程,看里面关于文件操作的部分。一般来说,只要下面几个函数就差不多了:
fopen
fwrite
fread
fseek
feof
fprintf
fscanf
fclose
或者去看别人写出的实际的例子,那样有助于理解。

D. 字符在计算机中的存储形式

字符在计算机内存放,应规定相应的代表字符的二进制代码。代码的选用要与有关外围设备的规格取得一致。这些外围设备包括键盘控制台的输入输出、打印机的输出等等。字符作输入时,要自动转换为二进制代码存于机内;输出时,计算机内二进制代码自动转化为字符,两者的转换全是靠外围设备实现的。字符是数据结构中最小的数据存取单位。通常由8个二进制位(一个字节)来表示一个字符,但也有少数计算机系统采用6个二进制的字符表示形式。一个系统中字符集的大小,完全由该系统自己规定。[1]计算机可用字符一般为128~256个(不包括汉字时),每个字符进入计算机后,都将转换为8位二进制数。不同的计算机系统和不同的语言,所能使用的字符范围是不同的。
在 ASCII 编码中,一个英文字母字符存储需要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符存储需要2个字节。在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。在UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。在UTF-32编码中,世界上任何字符的存储都需要4个字节。[3]
表达
字符是可使用多种不同字符方案或代码页来表示的抽象实体。例如,Unicode UTF-16 编码将字符表示为 16 位整数序列,而 Unicode UTF-8 编码则将相同的字符表示为 8 位字节序列。[3]微软的公共语言运行库使用 Unicode UTF-16(Unicode 转换格式,16 位编码形式)表示字符。
作用
针对微软公共语言运行库的应用程序使用编码将字符表示形式从本机字符方案映射至其他方案。应用程序使用解码将字符从非本机方案映射至本机方案。
电脑和通讯设备会使用字符编码的方式来表达字符。意思是会将一个字符指定给某个东西。传统上,是代表整数量的位元序列,如此,则可透过网络来传输,同时亦便于储存。两个常用的例子是ASCII和用于统一码的UTF-8。根据谷歌的统计,UTF-8是最常用于网页的编码方式。相较于大部分的字符编码把字符对应到数字或位元串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符

E. 汉字在计算机中是如何存储的

计算机的软件系统可分为
D)系统软件和应用软件
(2)
微型计算机系统采用总线结构对CPU、存储器和外部设备进行连接。总线通常由三部分组成,它们是
D)
数据总线、地址总线和控制总线
(3)计算机中所有信息的存储都采用
A)二进制
(4)下列叙述中,正确的是
C)软磁盘驱动器是存储介质
(5)第四代计算机的主要元器件采用的是
D)大规模和超大规模集成电路
(6)下列叙述中,错误的是
B)把源程序转换为目标程序的过程叫编译
(7)计算机硬件的五大基本构件包括:运算器、存储器、输入设备、输出设备和
B)控制器
(8)微型计算机内存储器是
C)
按字长编址
(9)通常所说的I/O设备指的是
A)输入输出设备
(10)"计算机辅助设计"的英文缩写是
A)CAD
(11)计算机的存储单元中存储的内容
C)可以是数据和指令
(12)某一台微型计算机的内存容量为128M,指的是
D)128000K字
(13)存储一个汉字的内码所需的字节数是
D)
2个
(14)下列字符中,ASCII码值最小的是
A)a
(15)十进制数105转换成二进制数是
A)01101001
(16)微型计算机存储系统中,PROM是______。
D、可编程只读存储器
(17)按16×16点阵存放国标GB2312-80中一级汉字(共3755个)的汉字库,大约需占存储空间______。
B、512KB

F. 汉字在计算机内存中,到底是以什么形式存在的

大体上没错。保存在硬盘上的就是01编码。用unicode编码的。gbk编码,utf8编码的汉字。编码是不一样的。
读出来编码。再从你电脑使用的默认字体里找到对应的图形显示出来。

G. 汉字在电脑中如何存储的

1.每个英文字符对应一个字节----这就是ASCII码,如31-'1',41-'A','61'-'a'.美国人定的标准.
2.汉字采用2字节编码(现在不完全准确),国家制定.现在的标准是GB18030,早期是GB2312-80.前者含盖后者.
3.一个字节是8位,ASCII码最高位是'0'(所以最多128个编码).
4.汉字将最高位置为'1',与ASCII码(英文符号)区隔开.
5.软件当读取一个字节时,先判断最高位是否为'0'.若是,则作英文符号处理;若不是,再读取下一个字节,两个字节合一处对应一个汉字.如,B0A1-'啊',D5FE-'政'.
6.无论是ASCII码还是汉字编码,相当于身份证号.实际显示出的汉字要到一个叫"汉字模库'的文件中提取,它的位置与编码有相对应的关系.

H. 在计算机中,汉字采用什么码存放。

机内码。计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。 汉字交换码(国标码)主要用于汉字信息交换,《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码。

国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变。

(8)汉字在电脑存储方式扩展阅读

汉字用两个字节表示,原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。

这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。

I. 汉字在计算机内部都是以()形式存储的 a:交换码 b:机内码 c:国标码 d:区位码

d:区位码。
汉字是以机内码的形式存储的