当前位置:首页 » 服务存储 » 存储系统设计汉字字库
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

存储系统设计汉字字库

发布时间: 2022-06-29 13:36:16

① 汉字系统中的汉字字库里存放的是汉字的什么码

汉字系统中的汉字字库里存放的是汉字的字形码,存储的是机内码。

② 在汉字处理系统中二级字库共有6 763个汉字,需要用( )字节

汉字处理系统中二级字库,是指:16×16的点阵字库
如果题目说的是16×16的点阵字库,那么就是每个汉字占32字节.
6 763个汉字,需要用(6 763 × 32)字节 .

③ 汉字系统中的汉字字库里存放的汉字的(谢谢回答) A 机内码 B输入码 C 字形码 D国标码

汉字系统中的汉字字库里存放的汉字的是C字形码。

A机内码:汉字在计算机内存储、处理时的编码

B输入码:输入汉字时使用的编码,如全拼输入“中”时,中的输入码为“zhong”

C字形码:为在计算机内表示汉字而统一的编码方式形成汉字编码叫内码,内码是惟一的。为方便汉字输入而形成的汉字编码为输入码,属于汉字的外码,输入码因编码方式不同而不同,是多种多样的。为显示和打印输出汉字而形成的汉字编码为字形码,计算机通过汉字内码在字模库中找出汉字的字形码,实现其转换。

D国标码:中华人民共和国官方强制使用GB 18030标准,但较旧的计算机仍然使用GB 2312。

所以正确答案为C。

(3)存储系统设计汉字字库扩展阅读:

汉字编码的类型。

整字输入法:将三四千个常用汉字排列在一个具有三四百个键位的大键盘上。大多是将这些汉字按XY坐标排列在一张字表上,通常叫“字表法”,或“笔触字表法”。

字形分解法:将汉字的形体分解成笔画或部件,按一定顺序输进机器。笔画一般分成 8种:横一、竖(丨)、撇(丿)、点(丶)、折(□)、弯(□)、叉十、方(口)。部件一般归纳出一二百个。

字形为主、字音为辅的编码法:这种编码法与字形分解法的不同在于还要利用某些字音信息。如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码,有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。

全拼音输入法:绝大多数是以现行的汉语拼音方案为基础进行设计。关键问题是区分同音字,因而有的方案提出“以词定字”的方法,还有的方案提出“拼音-汉字转换法”,即“汉语拼音输入 ──机内软件变换(实为查机器词表)──汉字输出”系统。

拼音为主、字形为辅的编码法:在拼音码前面或后面再添加一些字形码。拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”。

④ 64×64的点阵字库需要多少Byte空间存放一个汉字的字形码

64*64=4096 bit

4096/8=512 Byte =0.5KB

120*0.5=60 KB

1点阵是一位(bit),8位是一字节(Byte),1024字节是一“千字节”(KB)

(4)存储系统设计汉字字库扩展阅读:

一般的点阵规模有16×16,24×24,32×32,64×64等,每一个点在存储器中用一个二进制位(bit)存储。例如,在16×16的点阵中,需16×16bit=32 byte 的存储空间。在相同点阵中,不管其笔划繁简,每个汉字所占的字节数相等。

为了节省存储空间,普遍采用了字形数据压缩技术。所谓的矢量汉字是指用矢量方法将汉字点阵字模进行压缩后得到的汉字字形的数字化信息。

⑤ 汉字系统中的汉字字库里存放的是汉字的

汉字系统中的汉字字库里存放的是汉字的:机内码。

1.机内码是汉字在计算机内部存储、传送、交换的内部编码。

2.输入码就是使用英文键盘输入汉字时的编码。

3.国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。

4.国标码是汉字信息交换的标准编码。

(5)存储系统设计汉字字库扩展阅读:

字节结构

在使用GB2312的程序中,通常采用EUC储存方法,以便兼容于ASCII。浏览器编码表上的“GB2312”,通常都是指“EUC-CN”表示法。

每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”(也称“区字节)”,第二个字节称为“低位字节”(也称“位字节”)。

“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上 0xA0)。 由于一级汉字从16区起始,汉字区的“高位字节”的范围是0xB0-0xF7,“低位字节”的范围是0xA1-0xFE,占用的码位是 72*94=6768。其中有5个空位是D7FA-D7FE。

⑥ 汉子系统中的汉字字库里存放的是汉字的什么码

汉字系统中的汉字字库里存放的汉字的是C字形码。汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。

输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

具体解释

因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。

例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。

⑦ 汉字字库存储的是汉字的什么码

字库中存放的仅是汉字的字形;码表中是A汉字的输入码;
汉字的变换由系统软件完成输入码到汉字的内码的转换;
系统软件同时从字库中取出字形数据在屏幕上显示输入的汉字。

⑧ 汉字字库所占的储存器容量是多少千比特

一个汉字需用16×16点阵显示,一个字节(Byte)有8位(bit),一位代表一个点,故一个字节只能表示8个点,一个16×16点阵的汉字要占32
(2×16)个字节。3755个一级汉字共需3755×32=120160个字节。而1KB=1024Byte,所以一级汉字字库需占117KB存储空间,取2的整数次方,答案为128KB
16×16点阵表示一个汉字,字形码需用32字节,
即:字节数=点阵行数×点阵列数/8
(16×16/8)×3755/1024=117.34375KB
用24×24点阵来表示一个汉字
(24×24/8)×8836/1024=39762KB
1MB=1024KB

⑨ 什么是汉字字库

随着计算机的推广和普及,计算机汉字字库也一步一步地走向我
们。但人们对计算机汉字字库是如何产生的还不是很清楚。 汉字字库的发展大致经历了三个阶段,最初是点阵字库,之后是
向量字库,现在则用曲线字库。一套精美的汉字字库从设计到最后成
型,一般需要2-3年的时间。汉字字库的开发生产的流程大致可以分
为以下几个阶段:字体选型、字稿设计、字的扫描和数字化拟合、人
工修字和补字、质量检查、成库、功能测试。 字体选型是字库开发的基础工作。任何一套字体的选定都要经过
反复的比较、论证、试做,只有在字体风格、规范程度、字稿质量、
美观性等各方面都具有相当水平,才可以确定选用。计算机里使用的
每一种字体都要有一套相应的字库。市场上不仅可以见到宋、仿、黑、
楷、隶书等传统印刷字体,还可以见到行楷、姚体、舒体、美黑等一
大批风格各异、特点突出的新字体。据悉,北大方正现在已经开发出
72种简繁体字库。 一套完美的计算机汉字字库对字稿设计要求十分严格。首先要求
字体本身具有独特的气质和鲜明的风格,其次要求字稿中所有的字风
格统一、匀称美观,符合笔形规范,而且还要求达到一定的制作标准
和一定的字数。字稿要专门的书法家来书写,有时为了使字体风格一
样,一套字体要写几遍。不同的字库所包括的字数不尽相同,一般的
字库都包括国标三级简码共6763个简化汉字。在此基础上,不同的公
司,不同的版本各有不同。例如北大方正最新版本的字库包括了近2万
个汉字,最近即将推出的一套字库包括5.6万个汉字。随着计算机的
日益发展,汉字字稿中计算机制作的比例不断增大。 扫描是手写汉字迈向计算机的第一步,即把字稿通过扫描仪扫成
高精度点阵,不失真地反映出原字稿的全貌。数字拟合则是由计算机
完成的工作。即根据不同字体的不同风格以及它们的不同编码,按照
一定的数学算法,通过调节相应的参数自动地拟合出尽可能接近原稿
的数字化汉字,以减少下一步人工修字的工作量。 虽然计算机的拟合效率很高,但是它还不能完全取代人。因为计
算机无法表现原稿中所蕴含的鲜明的、人格化的韵味。修字是一项工
程量十分巨大的系统工程,一般的简体字库有7000多字,现在的GBK字
库则有2万多字。在修字过程中,造字软件是十分重要的。利用软件可
以对字形进行修边、平移、复制、缩放、翻转、增删笔划等方面的修
改。另外,软件强大的拼字、补字功能,可以有效地索引到每一个已
作好的字,用以造出与字稿风格特点完全相同的字。 汉字字库经人工修补后,还要经专门的工作人员进行质量检验。
为了检验输出效果,每一套字都要出大量的、各种版式的样张。对于
有些字体还要请有关专家进行审核。 一套字库在经过以上各步骤的相应处理后,由专门人员负责装库,
配上相应的符号及数字、外文等,根据需要,组织、转换成不同编码、
不同格式的字库。 最后,字库还要经过严格的测试。测试包括字形、质量、使用、
输出以及产品的完整性、适用性、合理性、兼容性等多个方面。这样
的产品就是我们日常使用的计算机汉字字库。