當前位置:首頁 » 服務存儲 » 漢字在電腦存儲方式
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

漢字在電腦存儲方式

發布時間: 2022-09-23 07:54:15

A. 計算機中如何存儲中文漢字信息

首先計算機存儲的是1和0,而對應ASCII碼,每個字母或部分符號對應了一個8位的2進制數,查表即可得一個字母或符號
計算機中漢字編碼一般採用兩個高位(左邊第一位)為1
的ASCⅡ碼表示一個漢字。即用兩個位元組表示一個漢字。
漢字在計算機內的編碼很復雜,涉及漢字的各種代碼,如漢字輸入碼,漢字機內碼,漢字交換碼,漢字字形碼等。

B. 漢字信息在計算機中通常是以______形式存儲的

計算機內部用於漢字信息的存儲、運算的信息代碼稱為漢字內碼。

漢字內碼指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。

(2)漢字在電腦存儲方式擴展閱讀:

漢字機內碼、國標碼和區位碼三者之間的關系為:區位碼(十進制)的兩個位元組分別轉換為十六進制後加2020H得到對應的國標碼;機內碼是漢字交換碼(國標碼)兩個位元組的最高位分別加1。

即漢字交換碼(國標碼)的兩個位元組分別加80H得到對應的機內碼;區位碼(十進制)的兩個位元組分別轉換為十六進制後加A0H得到對應的機內碼。

C. 在各種計算機語言中漢字以什麼形式存在

漢字一般是以圖形方式(點陣或者矢量等)儲存在字型檔里,系統或者應用程序調用的時候用漢字編碼就可以了。C語言也是一樣。也有個別的軟體,例如早期的游戲會自己製作一個小字型檔,裡面只有自己需要的那些字就夠了。如果沒有中文環境,使用漢字的程序會無法顯示,一般顯示為亂碼,也就是漢字本身不是直接保存在C程序里的。
說的糊里糊塗,可能有不對的地方,原理上應該是那樣的。
是指用C程序打開文件,類似記事本那種查找插入功能?這有專門的排序,查找位置的方法。還要看文件的存儲形式。你多了解一些就會了。比如從怎麼建立一個文件開始.
當初學過的一點C語言早就忘光了。只能建議你去找點turbo
c的教程,看裡面關於文件操作的部分。一般來說,只要下面幾個函數就差不多了:
fopen
fwrite
fread
fseek
feof
fprintf
fscanf
fclose
或者去看別人寫出的實際的例子,那樣有助於理解。

D. 字元在計算機中的存儲形式

字元在計算機內存放,應規定相應的代表字元的二進制代碼。代碼的選用要與有關外圍設備的規格取得一致。這些外圍設備包括鍵盤控制台的輸入輸出、列印機的輸出等等。字元作輸入時,要自動轉換為二進制代碼存於機內;輸出時,計算機內二進制代碼自動轉化為字元,兩者的轉換全是靠外圍設備實現的。字元是數據結構中最小的數據存取單位。通常由8個二進制位(一個位元組)來表示一個字元,但也有少數計算機系統採用6個二進制的字元表示形式。一個系統中字元集的大小,完全由該系統自己規定。[1]計算機可用字元一般為128~256個(不包括漢字時),每個字元進入計算機後,都將轉換為8位二進制數。不同的計算機系統和不同的語言,所能使用的字元范圍是不同的。
在 ASCII 編碼中,一個英文字母字元存儲需要1個位元組。在 GB 2312 編碼或 GBK 編碼中,一個漢字字元存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。[3]
表達
字元是可使用多種不同字元方案或代碼頁來表示的抽象實體。例如,Unicode UTF-16 編碼將字元表示為 16 位整數序列,而 Unicode UTF-8 編碼則將相同的字元表示為 8 位位元組序列。[3]微軟的公共語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字元。
作用
針對微軟公共語言運行庫的應用程序使用編碼將字元表示形式從本機字元方案映射至其他方案。應用程序使用解碼將字元從非本機方案映射至本機方案。
電腦和通訊設備會使用字元編碼的方式來表達字元。意思是會將一個字元指定給某個東西。傳統上,是代表整數量的位元序列,如此,則可透過網路來傳輸,同時亦便於儲存。兩個常用的例子是ASCII和用於統一碼的UTF-8。根據谷歌的統計,UTF-8是最常用於網頁的編碼方式。相較於大部分的字元編碼把字元對應到數字或位元串,摩斯密碼則是使用不定長度的電子脈沖的序列來表現字元

E. 漢字在計算機中是如何存儲的

計算機的軟體系統可分為
D)系統軟體和應用軟體
(2)
微型計算機系統採用匯流排結構對CPU、存儲器和外部設備進行連接。匯流排通常由三部分組成,它們是
D)
數據匯流排、地址匯流排和控制匯流排
(3)計算機中所有信息的存儲都採用
A)二進制
(4)下列敘述中,正確的是
C)軟磁碟驅動器是存儲介質
(5)第四代計算機的主要元器件採用的是
D)大規模和超大規模集成電路
(6)下列敘述中,錯誤的是
B)把源程序轉換為目標程序的過程叫編譯
(7)計算機硬體的五大基本構件包括:運算器、存儲器、輸入設備、輸出設備和
B)控制器
(8)微型計算機內存儲器是
C)
按字長編址
(9)通常所說的I/O設備指的是
A)輸入輸出設備
(10)"計算機輔助設計"的英文縮寫是
A)CAD
(11)計算機的存儲單元中存儲的內容
C)可以是數據和指令
(12)某一台微型計算機的內存容量為128M,指的是
D)128000K字
(13)存儲一個漢字的內碼所需的位元組數是
D)
2個
(14)下列字元中,ASCII碼值最小的是
A)a
(15)十進制數105轉換成二進制數是
A)01101001
(16)微型計算機存儲系統中,PROM是______。
D、可編程只讀存儲器
(17)按16×16點陣存放國標GB2312-80中一級漢字(共3755個)的漢字型檔,大約需占存儲空間______。
B、512KB

F. 漢字在計算機內存中,到底是以什麼形式存在的

大體上沒錯。保存在硬碟上的就是01編碼。用unicode編碼的。gbk編碼,utf8編碼的漢字。編碼是不一樣的。
讀出來編碼。再從你電腦使用的默認字體里找到對應的圖形顯示出來。

G. 漢字在電腦中如何存儲的

1.每個英文字元對應一個位元組----這就是ASCII碼,如31-'1',41-'A','61'-'a'.美國人定的標准.
2.漢字採用2位元組編碼(現在不完全准確),國家制定.現在的標準是GB18030,早期是GB2312-80.前者含蓋後者.
3.一個位元組是8位,ASCII碼最高位是'0'(所以最多128個編碼).
4.漢字將最高位置為'1',與ASCII碼(英文符號)區隔開.
5.軟體當讀取一個位元組時,先判斷最高位是否為'0'.若是,則作英文符號處理;若不是,再讀取下一個位元組,兩個位元組合一處對應一個漢字.如,B0A1-'啊',D5FE-'政'.
6.無論是ASCII碼還是漢字編碼,相當於身份證號.實際顯示出的漢字要到一個叫"漢字模庫'的文件中提取,它的位置與編碼有相對應的關系.

H. 在計算機中,漢字採用什麼碼存放。

機內碼。計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。 漢字交換碼(國標碼)主要用於漢字信息交換,《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元進行了編碼。

國標碼是漢字信息交換的標准編碼,但因其前後位元組的最高位為0,與ASCII碼發生沖突,國標碼是不可能在計算機內部直接採用的,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變。

(8)漢字在電腦存儲方式擴展閱讀

漢字用兩個位元組表示,原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。

這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。

I. 漢字在計算機內部都是以()形式存儲的 a:交換碼 b:機內碼 c:國標碼 d:區位碼

d:區位碼。
漢字是以機內碼的形式存儲的