當前位置:首頁 » 服務存儲 » 用2個存儲單元怎麼表示機內碼
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

用2個存儲單元怎麼表示機內碼

發布時間: 2022-05-20 03:45:01

1. 什麼是計算機的機內碼

漢字的機內碼是計算機系統內部對漢字進行存儲、處理、傳輸統一使用的代碼,又稱為漢字內碼。由於漢字數量多,一般用2個位元組來存放漢字的內碼。在計算機內漢字字元必須與英文字元區別開來,以免造成混亂。漢字機內碼中兩個位元組的最高位均置1。

2. 機內碼、國際碼、區位碼之間如何換算

一般換算全部用十六進制。機內碼、國際碼是十六進制的,區位碼是十進制的。具體換算步驟:(H表示十六進制,D表示十進制)

1、將四位數的區位碼分為兩部分,兩位數一組。

2、將這兩個兩位數換算為十六進制,運用公式進行計算。

國際碼=區位碼(十六進制)+2020H

機內碼=國際碼+8080H

例如:某漢字的區位碼是2534。則25D=19H,34D=22H

則國際碼=1922H+2020H=3952H,機內碼=3952H+8080H=B9D2H

(2)用2個存儲單元怎麼表示機內碼擴展閱讀

區位碼、國標碼與機內碼都是漢字的編碼形式,它們之間有著千絲萬縷的聯系,但其間的區別也是不容忽視的。

國標碼是基礎,指國家標准漢字編碼。即《信息交換用漢字編碼字元集(基本集)》,簡稱GB-2312。該字元集有漢字6763個。設有94個區,每個區94個位。每個漢字有一個固定的區位。

區位碼與國標碼的區別在於,在GB-2312中預留了一些空位,便於補充和擴展,經過擴展的區位碼字元數量及范圍就超過了GB-2312。而且台灣、香港、及日韓也是用區位碼的,但其區位號與大陸用的就完全不相同。

機內碼是為了避免ASCII碼和國標碼同時使用時產生兩義性問題,大部分漢字系統都採用將國標碼每個位元組高位置1作為漢字機內碼。這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具有極簡單的對應關系。

3. 機內碼的符號是怎麼樣的

計算機中信息的編碼
在計算機中,各種信息都是以二進制編碼的形式存在的;也就是說,不管是文字、圖形、聲音、動畫,還是電影等各種信息,在計算機中都是以0和1組成的二進制代碼表示的;計算機之所以能區別這些信息的不同,是因為它們採用的編碼規則不同。比如:同樣是文字,英文字母與漢字的編碼規則就不同,英文字母用的是單位元組的ASCII碼,漢字採用的是雙位元組的漢字內碼;但隨著需求的變化,這兩種編碼有被統一的UNICODE碼(由Unicode 協會開發的能表示幾乎世界上所有書寫語言的字元編碼標准)所取代的趨勢;當然圖形、聲音等的編碼就更復雜多樣了。這也就告訴我們,信息在計算機中的二進制編碼是一個不斷發展的、高深的、跨學科的知識領域。
1、字元(英文,包括字母、數字、標點、運算符等)編碼
字元的編碼採用國際通用的ASCII碼(American Standard Code for Information Interchange,美國信息交換標准代碼),每個ASCII碼以1個位元組(Byte)儲存,從0到數字127代表不同的常用符號,例如大寫A的ASCII碼是65,小寫a則是97。由於ASCII碼只用了位元組的七個位,最高位並不使用,所以後來又將最高的一個位也編入這套編碼碼中,成為八個位的延伸ASCII(ExtendedASCII)碼,這套內碼加上了許多外文和表格等特殊符號,成為目前常用的編碼。基本的ASCII字元集共有128個字元,其中有96個可列印字元,包括常用的字母、數字、標點符號等,另外還有32個控制字元。標准ASCII碼使用7個二進位對字元進行編碼,對應的ISO標准為ISO646標准。下表展示了基本ASCII字元集及其編碼:
字母和數字的ASCII碼的記憶是非常簡單的。我們只要記住了一個字母或數字的ASCII碼(例如記住A為65,0的ASCII碼為48),知道相應的大小寫字母之間差32,就可以推算出其餘字母、數字的ASCII碼。
雖然標准ASCII碼是7位編碼,但由於計算機基本處理單位為位元組(1byte = 8bit),所以一般仍以一個位元組來存放一個ASCII字元。每一個位元組中多餘出來的一位(最高位)在計算機內部通常保持為0(在數據傳輸時可用作奇偶校驗位)。由於標准ASCII字元集字元數目有限,在實際應用中往往無法滿足要求。為此,國際標准化組織又制定了ISO2022標准,它規定了在保持與ISO646兼容的前提下將ASCII字元集擴充為8位代碼的統一方法。ISO陸續制定了一批適用於不同地區的擴充ASCII字元集,每種擴充ASCII字元集分別可以擴充128個字元,這些擴充字元的編碼均為高位為1的8位代碼(即十進制數128~255),稱為擴展ASCII碼。下表展示的是最流行的一套擴展ASCII字元集和編碼:
2、漢字的編碼
(1)漢字內碼
漢字信息在計算機內部也是以二進制方式存放。由於漢字數量多,用一個位元組的128種狀態不能全部表示出來,因此在1980年我國頒布的《信息交換用漢字編碼字元集——基本集》,即國家標准GB2312-80方案中規定用兩個位元組的十六位二進製表示一個漢字,每個位元組都只使用低7位(與ASCII碼相同),即有128×128=16384種狀態。由於ASCII碼的34個控制代碼在漢字系統中也要使用,為不致發生沖突,不能作為漢字編碼,128除去34隻剩94種,所以漢字編碼表的大小是94×94=8836,用以表示國標碼規定的7445個漢字和圖形符號。
每個漢字或圖形符號分別用兩位的十進制區碼(行碼)和兩位的十進制位碼(列碼)表示,不足的地方補0,組合起來就是區位碼。把區位碼按一定的規則轉換成的二進制代碼叫做信息交換碼(簡稱國標碼)。國標碼共有漢字6763個(一級漢字,是最常用的漢字,按漢語拼音字母順序排列,共3755個;二級漢字,屬於次常用漢字,按偏旁部首的筆劃順序排列,共3008個),數字、字母、符號等682個,共7445個。
由於國標碼不能直接存儲在計算機內,為方便計算機內部處理和存儲漢字,又區別於ASCII碼,將國標碼中的每個位元組在最高位改設為1,這樣就形成了在計算機內部用來進行漢字的存儲、運算的編碼叫機內碼(或漢字內碼,或內碼)。內碼既與國標碼有簡單的對應關系,易於轉換,又與ASCII碼有明顯的區別,且有統一的標准(內碼是惟一的)。

(2)漢字外碼
無論是區位碼或國標碼都不利於輸入漢字,為方便漢字的輸入而制定的漢字編碼,稱為漢字輸入碼。漢字輸入碼屬於外碼。不同的輸入方法,形成了不同的漢字外碼。常見的輸入法有以下幾類:
按漢字的排列順序形成的編碼(流水碼):如區位碼;
按漢字的讀音形成的編碼(音碼):如全拼、簡拼、雙拼等;
按漢字的字形形成的編碼(形碼):如五筆字型、鄭碼等;
按漢字的音、形結合形成的編碼(音形碼):如自然碼、智能ABC。
輸入碼在計算機中必須轉換成機內碼,才能進行存儲和處理。

(3)漢字字形碼
為了將漢字在顯示器或列印機上輸出,把漢字按圖形符號設計成點陣圖,就得到了相應的點陣代碼(字形碼)。
全部漢字字碼的集合叫漢字字型檔。漢字型檔可分為軟字型檔和硬字型檔。軟字型檔以文件的形式存放在硬碟上,現多用這種方式,硬字型檔則將字型檔固化在一個單獨的存儲晶元中,再和其它必要的器件組成介面卡,插接在計算機上,通常稱為漢卡。
用於顯示的字型檔叫顯示字型檔。顯示一個漢字一般採用16×16點陣或24×24點陣或48×48點陣。已知漢字點陣的大小,可以計算出存儲一個漢字所需佔用的位元組空間。例:用16×16點陣表示一個漢字,就是將每個漢字用16行,每行16個點表示,一個點需要1位二進制代碼,16個點需用16位二進制代碼(即2個位元組),共16行,所以需要16行×2位元組/行=32位元組,即16×16點陣表示一個漢字,字形碼需用32位元組。
即:位元組數=點陣行數×點陣列數/8
用於列印的字型檔叫列印字型檔,其中的漢字比顯示字型檔多,而且工作時也不像顯示字型檔需調入內存。
可以這樣理解,為在計算機內表示漢字而統一的編碼方式形成漢字編碼叫內碼(如國標碼),內碼是惟一的。為方便漢字輸入而形成的漢字編碼為輸入碼,屬於漢字的外碼,輸入碼因編碼方式不同而不同,是多種多樣的。為顯示和列印輸出漢字而形成的漢字編碼為字形碼,計算機通過漢字內碼在字模庫中找出漢字的字形碼,實現其轉換。

4. 省級計算機試題「以下是用十六進製表示的兩個連續的存儲單元」其中 () 一定不是漢字編碼。

按照漢字在計算機中處理過程的不同,漢字編碼可以分漢字輸入碼(外碼),漢字機內碼(內碼)和漢字字模碼(字型碼)。
1、漢字輸入時:漢字輸入碼(外碼),如區位碼,拼音碼,五筆字型碼。
其中只有區位碼沒有重碼。由區碼和位碼組成,其十進制編碼范圍為:0101~9494,即十六進制編碼范圍為0101H~5E5EH。(有關區位碼的詳細情況,如果有興趣,請在網上查詢相關資料。)
2、漢字存儲、檢索、傳輸時:漢字機內碼,其編碼是將國際碼每個位元組最高位設為1,以避免與ASCII碼相沖突,而國際碼的編碼可由區位碼+2020H得到,即國際碼編碼范圍為:2121H~7F7FH;也就是說二進制編碼范圍為:0010000100100001~0111111101111111。機內碼就是將國際碼每個位元組最高位置為1,其范圍為:1010000110100001~1111111111111111,十六進制范圍為:A1A1H~FFFFH
3、漢字顯示、列印輸入時:漢字字模碼,其編碼是用來表達字元的點陣信息的。題目中給出的四個選項的編碼,每個只有2個位元組,無法有效構成漢字點陣。
綜上所述:答案應為A。

5. 機內碼的表示

16位

6. 機內碼,輸入碼,處理碼,字形碼,區位碼的定義

機內碼是指計算機漢字系統中使用的二進制字元編碼,是溝通輸入、輸出與系統平台之間的交換碼,通過內碼可以達到通用和高效率傳輸文本的目的。

輸入碼是指用戶從鍵盤上鍵入漢字時所使用的漢字編碼。如輸入碼:區位碼等,拼音編碼:全拼、雙拼、自然碼等,字形編碼:五筆、表形碼等。

處理碼是英文信息處理的標准編碼,是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。

字形碼是點陣代碼的一種。是為了將漢字在顯示器或列印機上輸出,把漢字按圖形符號設計成點陣圖,得到的相應的點陣代碼。

區位碼是一個四位的十進制數,每個區位碼都對應著一個唯一的漢字或符號,它的前兩位叫做區碼,後兩位叫做位碼。

(6)用2個存儲單元怎麼表示機內碼擴展閱讀:

由於歷史、地區原因,有時一種文字會出現多種編碼方案,特別是漢字。由於不同於系統內碼的字元不能在該系統中正常顯示,必須要進行字元的內碼轉換,即將非系統內碼的字元轉換為系統可以識別的內碼字元。

在區位碼中,01-09區為特殊字元,10-55區為一級漢字(3755個最常用的漢字,按拼音字母的次序排列),56-87區為二級漢字(3008個漢字,按部首次序排列), 在區位碼漢字輸入方法中,漢字編碼無重碼。

在熟練掌握漢字的區位碼後,錄入漢字的速度是很快的,但若想記憶住全部區位碼是相當困難的,常使用於錄入特殊符號,如製表符、希臘字母等。

7. 4kb的存儲容量可以存放幾個用機內碼表示的漢字為什麼

4kb可以存放2048個漢字。
4kb就是4096個位元組,而漢字機內碼用兩個位元組表示,所以就是2048個漢字。

8. 一個漢字的機內碼需用幾個位元組存儲

一個漢字的機內碼需用2個位元組存儲。

我國國家標准局於1981年5月頒布了《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元進行了編碼,其編碼原則為:漢字用兩個位元組表示。

原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。

這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。

(8)用2個存儲單元怎麼表示機內碼擴展閱讀:

機內碼的相關規定:

國家標准局頒布的《信息交換用漢字編碼字元集基本集》(代號為GB2312-80)規定的漢字交換碼作為國家標准漢字編碼。

GB2312-80中共有7445個字元符號:漢字元號6763個一級漢字3755個(按漢語拼音字母順序排列)二級漢字3008個(按部首筆劃順序排列)非漢字元號682個GB2312-80規定,鍵盤是當前微機的主要輸入設備,輸入碼就是使用英文鍵盤輸入漢字時的編碼。

目前,我國已推出的輸入碼有數百種,但用戶使用較多的約為十幾種,按輸入碼編碼的主要依據,大體可分為順序碼、音碼、形碼、音形碼四類,如「保」字,用全拼,輸入碼為「BAO」,用區位碼,輸入碼為「1703」,用五筆字型則為「WKS」。

參考資料來源:網路-機內碼

9. 一個漢字的國標碼需用2個位元組存儲,其每個位元組的最高二進制位的值分別為

如果是一個漢字的內碼需用2個位元組存儲,其每個位元組的最高二進制位的值就為1.1。

國標碼是漢字編碼的標准,而不是存儲的標准。就國標碼的編碼而言,其前後位元組的最高位均為0。

漢字的存儲,使用的是機內碼。國標碼是漢字信息交換的標准編碼,但因其前後位元組的最高位為0,與ASCII碼發生沖突,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變,因此機內碼前後位元組最高位都為1。

(9)用2個存儲單元怎麼表示機內碼擴展閱讀:

因為漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。例如:有兩個位元組的內容為30H和21H,它既可表示漢字「啊」的國標碼,又可表示西文「0」和「!」的ASCII碼。為此,漢字機內碼應對國標碼加以適當處理和變換。

國標碼的機內碼為二位元組長的代碼,它是在相應國標碼的每個位元組最高位上加「1」,即

漢字機內碼=漢字國標碼+8080H

例如,上述「啊」字的國標碼是3021H,其漢字機內碼則是B0A1H。

漢字機內碼的基礎是漢字國標碼。

10. 2KB的內存能存儲( )個漢字的機內碼

一個漢字是2位元組,2KB是2048位元組,所以可能存儲1024個。

漢字機內碼在計算機內的存儲的描述是,其使用二個位元組存儲,每個位元組最高位一位為1。計算機中, 補碼第一位是符號位, 1 表示為負數,所以 漢字機內碼的每個位元組表示的十進制數都是負數。

(10)用2個存儲單元怎麼表示機內碼擴展閱讀:

漢字機內碼的換算:

1KB=1024B;1MB=1024KB=1024×1024B。其中1024=2 10。

1B(byte,位元組)= 8 bit(見下文)。

1KB(Kibibyte,千位元組)=1024B= 2^10 B。

1 MB(Mebibyte, 兆位元組,百萬位元組,簡稱「兆」)=1024KB= 2^20 B。

1 GB(Gigabyte, 吉位元組,十億位元組,又稱「千兆」)=1024MB= 2^30 B。

1 TB(Terabyte,萬億位元組,太位元組)=1024GB= 2^40 B。

1 PB(Petabyte,千萬億位元組, 拍位元組)=1024TB= 2^50 B。

1 EB(Exabyte,百億億位元組, 艾位元組)=1024PB= 2^60 B。

1 ZB(Zettabyte,十萬億億位元組,澤位元組)= 1024EB= 2^70 B。

1 YB(Yottabyte,一億億億位元組, 堯位元組)= 1024ZB= 2^80 B。

1 BB(Brontobyte,一千億億億位元組)= 1024YB= 2^90 B。

1NB(NonaByte,一百萬億億億位元組) = 1024 BB = 2^100 B。

1DB(DoggaByte,十億億億億位元組) = 1024 NB = 2^110 B。