當前位置:首頁 » 服務存儲 » 存儲一個漢字需要的字元
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

存儲一個漢字需要的字元

發布時間: 2022-07-29 12:59:16

① 一個漢字,等於2個字元嗎﹖

一個漢字字元存儲需要2個位元組。

字元是指計算機中使用的字母、數字、字和符號,包括:1、2、3、A、B、C、~!·#¥%……—*()——+等等。在 ASCII 編碼中,一個英文字母字元存儲需要1個位元組。

在 GB 2312 編碼或 GBK 編碼中,一個漢字字元存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。

在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。

(1)存儲一個漢字需要的字元擴展閱讀:

計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。 漢字交換碼(國標碼)主要用於漢字信息交換,我國國家標准局於1981年5月頒布了《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80。

共對6763個漢字和682個圖形字元進行了編碼,其編碼原則為:漢字用兩個位元組表示,原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。

這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。

② 一個漢字等於多少字元

一個漢字等於2個字元。

在 ASCII 編碼中,一個英文字母字元存儲需要1個位元組。在 GB 2312 編碼或 GBK 編碼中,一個漢字字元存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。

在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。

(2)存儲一個漢字需要的字元擴展閱讀

字元的作用

1、字元是可使用多種不同字元方案或代碼頁來表示的抽象實體。

2、應用程序使用解碼將字元從非本機方案映射至本機方案。

3、電腦和通訊設備會使用字元編碼的方式來表達字元。意思是會將一個字元指定給某個東西。

4、兩個常用的例子是ASCII和用於統一碼的UTF-8。

③ 一個漢字到底是多少個字元,高手請進

一個漢字佔用2個字元。

在 ASCII 編碼中,一個英文字母的字元存儲需來要1個位元組。在 GB 2312 編碼或 GBK 編碼中,一個漢字字元自存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。

在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組百(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。

(3)存儲一個漢字需要的字元擴展閱讀

漢字的文字編碼標准主要有 ASCII、GB2312、GBK、Unicode等。ASCII 編碼是最簡單的西文編碼方案。GB2312、GBK、GB18030 是漢字字元編碼方案的國家標准。ISO/IEC 10646 和 Unicode 都是全球字元編碼的國際標准。

為了解決中國、日本和韓國的象形文字元和ASCII的某種兼容性,出現了雙位元組字元集,DBCS從 第256 代碼開始,就像ASCII一樣,最初的128個代碼是ASCII。

較高的128個代碼中的某些總是跟隨著第二個位元組。這兩個位元組一起(稱作首位元組和跟隨位元組)定義一個字元,通常是一個復雜的象形文字。

④ 計算機中存儲一個漢字需要幾位元組

一個漢字需要兩個位元組,英文則只需要一個位元組。
ASCII碼:一個英文字母(不分大小寫)佔一個位元組的空間。一個二進制數字序列,在計算機中作為一個數字單元,一般為8位二進制數。換算為十進制
,最小值-128,最大值127。如一個ASCII碼就是一個位元組。
UTF-8編碼:一個英文字元等於一個位元組,一個中文(含繁體)等於三個位元組。中文標點佔三個位元組,英文標點佔一個位元組
Unicode編碼:一個英文等於兩個位元組,一個中文(含繁體)等於兩個位元組。中文標點占兩個位元組,英文標點占兩個位元組。
(4)存儲一個漢字需要的字元擴展閱讀:
易混概念辨析
(1)字
在計算機中,一串數碼作為一個整體來處理或運算的,稱為一個計算機字,簡稱字。字通常分為若干個位元組(每個位元組一般是8位)。在存儲器中,通常每個單元存儲一個字,因此每個字都是可以定址的。字的長度用位數來表示。
在計算機的運算器、控制器中,通常都是以字為單位進行傳送的。字出現在不同的地址其含義是不相同。例如,送往控制器去的字是指令,而送往運算器去的字就是一個數。
(2)字長
計算機的每個字所包含的位數稱為字長。根據計算機的不同,字長有固定的和可變的兩種。固定字長,即字長度不論什麼情況都是固定不變的;可變字長,則在一定范圍內,其長度是可變的。
計算的字長是指它一次可處理的二進制數字的數目。計算機處理數據的速率,自然和它一次能加工的位數以及進行運算的快慢有關。如果一台計算機的字長是另一台計算機的兩倍,即使兩台計算機的速度相同,在相同的時間內,前者能做的工作是後者的兩倍。
一般地,大型計算機的字長為32-64位,小型計算機為12-32位,而微型計算機為4-16位。字長是衡量計算機性能的一個重要因素。
參考資料來源:搜狗網路-位元組

⑤ 一個字佔多少個字元

不同的編碼字所佔字元數是不同的:

1、GBKGB2312編碼:1個字佔2個位元組;

2、unicodeutf-8編碼(其他編碼等):1個字約佔2~4位元組,這種編碼里漢字是長度不是一定的,有的長、有的短。

字元是可使用多種不同字元方案或代碼頁來表示的抽象實體。例如,UnicodeUTF-16編碼將字元表示為 16 位整數序列,而 UnicodeUTF-8編碼則將相同的字元表示為 8 位位元組序列。微軟的公共語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字元。

(5)存儲一個漢字需要的字元擴展閱讀:

字元的作用:

針對微軟公共語言運行庫的應用程序使用編碼將字元表示形式從本機字元方案映射至其他方案。應用程序使用解碼將字元從非本機方案映射至本機方案。

電腦和通訊設備會使用字元編碼的方式來表達字元。意思是會將一個字元指定給某個東西。傳統上,是代表整數量的位元序列,如此,則可透過網路來傳輸,同時亦便於儲存。

兩個常用的例子是ASCII和用於統一碼的UTF-8。根據谷歌的統計,UTF-8是目前最常用於網頁的編碼方式。相較於大部分的字元編碼把字元對應到數字或位元串,摩斯密碼則是使用不定長度的電子脈沖的序列來表現字元。

⑥ 在32×32點陣的漢字字型檔中,存儲一個漢字的字模信息需要多少位元組

在32×32點陣的漢字字型檔中,存儲一個漢字的字模信息需要128節。

解析過程如下:

32×32=1024位

1位元組=8位

1024÷8=128B

32×32點陣的漢字字型檔中,存儲一個漢字的字模信息需要128位元組。

(6)存儲一個漢字需要的字元擴展閱讀

數位組一個在信息技術和數碼技術領域中,用於表示信息的數量的單位。

一個數位組是數個二進位的組合。早期的不同計算機系統中使用的數位組含有的二進位數目不盡相同。 但數位組在應用上已經統一,即,一個數位組通常由8個二進位組成。16個二進位合成一個字(word),32個二進位構成一個復字。

每個二進位,可用來代表兩種狀態之一,如電路的開/斷等)組成,因此可以代表個不同的狀態。4個二進位的組合稱為四位組(Nibble),8個二進位的組合則為一個八位組(Octet), 所以一個數位組通常是一個八位組。

數位組是一個承載信息的基本單元。一個數位組表明的信息由所用的編碼方式決定。不同的編碼方式有可能用一個或多個數位組來表示一個數字,一個符號,或者一幅圖像中的一個色點。常用的編碼方式如用來表示字元集的ASCII編碼或者ISO/IEC 8859標準的編碼。

位元組是在電腦內一個英文字所佔的最基本單元,而一個中文字是占兩個位元組的。

⑦ 存儲24*24 點陣的一個漢字信息,需要的位元組數是

存儲24*24 點陣的一個漢字信息,需要的位元組數是72。

每8個點所存儲空間等於1位元組,所以24×24/8=72。

中文並不一定是占兩個位元組的,具體佔多少位元組是跟具體的編碼方式相關的。比如說:GB2312、GBK、GB18030 編碼是佔用兩個位元組的,但是 UTF-8 編碼的話至少需要佔用三個位元組。有一個簡單方法,就是把大於 0xff 的字元都作為兩個字元(當然是在 GBK 環境下)。

1位元組等於8比特,一個字母是1位元組,而一個漢字要用2個位元組。一個漢字=2個字元。

(7)存儲一個漢字需要的字元擴展閱讀

漢字的處理過程計算機內部只能識別二進制,任何信息(包括字元、漢字、聲音、圖像等)在計算機中都是以二進制形式存放的。而漢字可以輸入到計算機中,在計算機中存儲,經過轉換,在屏幕上顯示或在列印機上列印。下面介紹漢字的處理過程。

這些編碼主要包括:漢字輸入碼、漢字內碼、漢字地址嗎、漢字字形碼等。這一系列的漢字編碼及轉換、漢字信息處理中的各編碼及流程如圖1所示。

通過鍵盤對每個漢字輸入規定的代碼,即漢字的輸入碼(例如拼音輸入碼)。不論哪一種漢字輸入方法,計算機都將每個漢字的漢字輸入碼轉換為相應的國際碼,然後再轉換為機內碼,就可以在計算機內存儲和處理了。

如果點陣中的一點用一比特來存儲的話,一個漢字的點陣就需要 24 X 24 / 8 = 72 位元組,那麼100個漢字的點陣就需要 100 X 72 = 7200 位元組。

一個漢字=2個英文字母=2位元組。

⑧ 漢字字模存儲漢字,每個漢字需多少位元組,存儲容量是多少

16×16點陣表示一個漢字,字形碼需用32位元組,
即:位元組數=點陣行數×點陣列數/8
(16×16/8)×3755/1024=117.34375KB
用24×24點陣來表示一個漢字
(24×24/8)×8836/1024=39762KB
1MB=1024KB,轉換成MB就不用我再算了吧!呵呵~~~~~要加分哦~

⑨ 儲存一個漢字需要多少位元組

這個要看你採用什麼編碼,一般Unicode是兩個位元組,不過UTF-8是三個位元組,還有GBK是兩位元組,但是GB18030中有些漢字是四位元組

⑩ 位元組、字元的區別,一個漢字是占兩個位元組還是兩個字元

一個漢字佔2個位元組。

位元組(Byte):位元組是通過網路傳輸信息(或在硬碟或內存中存儲信息)的單位。位元組是計算機信息技術用於計量存儲容量和傳輸容量的一種計量單位,1個位元組等於8位二進制,它是一個8位的二進制數,是一個很具體的存儲空間。

字元:計算機中使用的字母、數字、字和符號,包括:1、2、3、a、b、c、~!•#¥%……—*()——+等等,相當於這些東西的統稱。所以,1個漢字字元會佔用兩個英文字元的位置,存儲需要2個位元組;1個英文字元存儲只佔一個英文字元的位置,存儲需要1個位元組;2個數字為一個位元組。

不同數量級間

信息存儲量是度量存儲器存放程序和數據的數量。其主要度量單位是位元組,1個位元組(Byte)等於8位(b)二進制。位(bit,Binary Digits):存放一位二進制數,即0或1,為最小的存儲單位,8個二進制位為一個位元組單位。一個英文字母(不分大小寫)佔一個位元組的空間,一個中文漢字占兩個位元組的空間。英文標點佔一個位元組,中文標點占兩個位元組。

以上內容參考:網路-位元組