Ⅰ 三種信息存儲與組織方式各有什麼優劣適用於什麼場合
ry75r47yr7yyrsy5y
Ⅱ 軟、硬碟上的信息以什麼組織存儲的
哎~軟盤和硬碟的統稱都叫[磁碟],當然是用磁來記錄,
軟、硬碟的碟片上都布滿磁性物質,而磁性就必有南北極之分,磁頭就是通過電流來改變磁粒的南北極性
讀取是則是,北為0,南為1來代表電腦可以識別的2進制來提供給CPU處理。
Ⅲ 人腦中的信息存儲在哪
人腦的神經生物學結構亦稱腦實體結構,它是指由成百億神經元組成的具有復雜連接通路與迴路的龐大的神經網路。與生物的其它組織器官一樣,腦的神經網路首先是生物進化中遺傳、變異和自然選擇的產物。在物種進化中被創造出來的這種實體結構,被編碼在人的DNA序列中。作為遺傳基因載體的DNA雙螺旋,既能通過不斷的自我復制把編碼腦結構的信息傳遞給後代,又有在個體發育中通過轉錄RNA和轉譯蛋白質的方式把腦的神經網路結構在每一代個體中再現出來。因此,對每一個有認識能力的具體人來說,腦的神經生物學結構首先是由遺傳因素決定的先於自身經驗的結構。
人腦又是一個可塑性很強的神經器官。外界和內部環境中的各種作用或刺激能從個體發育和機能建構兩個水平上影響它的結構與功能的組織形式。
環境因素引起人腦的機能建構過程主要是信息結構的構築和與之相關的機能結構的形成過程。機能建構作用能把編碼在基因中的本能信息和同化於主體中的外來信息緊緊地嵌合在人腦的實體結構之中,逐漸形成不同於實體結構的腦機能結構。
神經心理學的興起使腦機能結構的研究成為一門日趨獨立的新興學科。在這一領域中,前蘇聯著名學者魯利亞做出了意義深遠的貢獻。他澄清了「機能」「定位」等對腦機能結構研究有重要意義的基本概念;創立了神經心理學的臨床測驗法;尤其是劃分出了人腦基本的機能結構系統。他認為,人腦有三個基本的機能聯合區,它們是:(1)保證調節緊張度或覺醒狀態的聯合區;(2)接受、加工和保存來自外部世界信息的聯合區;(3)制定程序、調節和控制心理活動的聯合區。每個機能聯合區又能進一步分成具有不同生理與心理功能的一級皮質區(或投射區)、二級皮質區(或投射-聯絡區)和三級皮質區(或重疊區)〔④〕。魯利亞的精闢見解和對腦機能結構所作的這些劃分,對現代心理學、認知科學的研究具有頗為重要的價值。然而,從腦科學今天的發展水平看,我認為他的研究仍有若干不足之處。其中最突出的,就是沒有把信息存儲系統(即記憶系統)作為一個獨立的機能結構系統提出來,僅把它說成是具有保存來自外部世界信息的第二機能聯合區的獨有功能。
心理學的實驗事實和大量的日常經驗早已示明,人腦不僅能保存來自外部世界的信息,還能保存人的活動技能,人體驗過的情緒、情感以及思維中使用的操作規則、方法策略等等。腦科學的新近研究也指出,人腦中三個基本機能聯合區所在的那些腦組織結構都是記憶信息存儲的場所,並不只限於第二機能聯合區的腦組織。與記憶信息的存入和取出有關的腦組織結構,主要是位於大腦皮層前額葉以及顳葉內下側的海馬和杏仁核等
人腦中的信息存儲系統也是一個最基本的機能結構系統(或機能聯合區)。這個機能聯合區與魯利亞的前三個聯合區有著並列且相互依存的功能。從腦的神經生物學結構看,信息存儲系統的腦組織除前額區、海馬、杏仁核等可做明顯區分外,其餘部分則和上述三個機能聯合區的腦組織重疊在一起,因而難於單獨區分。
綜上所述,人腦的機能結構不僅是發育過程中基因表達的產物,更是以攝取外界信息為前提的腦機能建構的結果。因而它是既包含先天因素又包含習得因素,既包括腦「硬體」又包括腦「軟體」的復雜統一體。人的認知結構、心理結構這類似乎看不見、摸不著的東西,就是嵌合在人腦的機能結構之中,並通過它轉變成了切實可見的存在物的
從腦的神經生物學結構看,信息存儲系統的腦組織除前額區、海馬、杏仁核等可做明顯區分外,其餘部分則和上述三個機能聯合區的腦組織重疊在一起,因而難於單獨區分。
從腦的神經生物學結構看,信息存儲系統的腦組織除前額區、海馬、杏仁核等可做明顯區分外,其餘部分則和上述三個機能聯合區的腦組織重疊在一起,因而難於單獨區分。
Ⅳ 信息存儲的作用
信息的儲存是信息系統的重要方面,如果沒有信息儲存,就不能充分利用已收集、加工所得信息,同時還要耗資、耗人、耗物來組織信息的重新收集、加工。有了信息儲存,就可以保證隨用隨取,為單位信息的多功能利用創造條件,從而大大降低了費用。
Ⅳ 計算機中的信息都是以什麼形式存放的
計算機中所有信息都是以二進制的形式存儲在電腦內部的。
二進位計數制僅用兩個數碼。0和1,所以,任何具有二個不同穩定狀態的元件都可用來表示數的某一位。而在實際上具有兩種明顯穩定狀態的元件很多。
例如,氖燈的"亮"和"熄";開關的」開「和」關「; 電壓的」高「和」低「、」正「和」負「;紙帶上的」有孔「和「無孔」,電路中的」有信號「和」無信號「,磁性材料的南極和北極等等。
利用這些截然不同的狀態來代表數字,是很容易實現的。不僅如此,更重要的是兩種截然不同的狀態不單有量上的差別,而且是有質上的不同。這樣就能大大提高機器的抗干擾能力,提高可靠性。
(5)信息組織存儲擴展閱讀:
二進位計數制的四則運算規則十分簡單。而且四則運算最後都可歸結為加法運算和移位,這樣,電子計算機中的運算器線路也變得十分簡單了。不僅如此,線路簡化了,速度也就可以提高。這也是十進位計數制所不能相比的。
由於二進位制有包括三進位制在內的其他進位制所沒有的優點,所以大多數電子計算機還是採用二進制。
此外,由於二進制中只用二個符號 「 0」 和「1」,因而可用布爾代數來分析和綜合機器中的邏輯線路。這為設計電子計算機線路提供了一個很有用的工具。
Ⅵ 古代 近代 現代的存儲信息方法有哪些
古代,將信息以書寫、印刷等形式記錄在石頭~竹簡~帛~紙上,形成書。
近代,以書寫、印刷等形式記錄在紙上。照相錄像技術發明後,就可以記錄畫面信息了。
現代,以列印和數據硬碟或雲服務存儲為主。
(6)信息組織存儲擴展閱讀:
存儲介質
紙張
優點:存量大,體積小,便宜,永久保存性好,並有不易塗改性。存數字、文字和圖像一樣容易。
缺點:傳送信息慢,檢索起來不方便
膠卷
優點:存儲密度大。查詢容易
缺點:閱讀時必須通過介面設備,不方便,價格昂貴。
計算機
優點:存取速度極快,存儲的數據量大
信息存儲應當決定,什麼信息存在什麼介質行比較合適。總的來說憑證文件應當用紙介質存儲;業務文件用紙或磁帶存儲;而主文件,如企業中企業結構;人事方面的檔案材料;設備或材料的庫存賬目,應當存於磁碟,以便聯機檢索和查詢。
參考鏈接:網路_信息儲存
Ⅶ 什麼是信息儲存
�鬩耍�讕帽4嫘院茫�⒂脅灰淄扛男浴4媸�幀⑽淖趾屯枷褚謊�菀住� 缺點:傳送信息慢,檢索起來不方便膠卷優點:存儲密度大。查詢容易 缺點:閱讀時必須通過介面設備,不方便,價格昂貴。 計算機 信息儲存-材料沿革 信息貯存材料在50年前到現在一直是以磁記錄為主。磁碟的記錄密度已經超過108位/厘米2,磁帶為0.2×108。磁碟和磁帶都是將磁粉(γ-Fe2O3鐵氧體)塗在磁碟或有機膜上而成,產品的成本低,穩定性好。60年代發展出CrO2和以(Co++)改性的氧化鐵粉是記錄密度更高的材料。70年代發展出超微細鐵粉(0.2μ×0.02μ),到80年代(BaO·6Fe2O3)鋇鐵氧體的超微細粉塗於(0.1μ直徑)和(0.01μ厚度圓盤)都具有良好的磁記錄性能。從50年代就開始研究的金屬薄膜記錄,目前已經發展出多種成分的薄膜材料:Co、CoNi、CoNiCr和CoCr/NiFe垂直記錄雙層薄膜等都具有廣泛的應用和發展前途。以下比較三種材料的磁記錄性能:鐵氧體(γ-Fe2O3)、濺射連續薄膜 (Co-Cr)、垂直記錄雙層膜(CoCr/FeNi),它們的商業應用水平分別為12,000 (位/吋)、40,000(位/吋)、150,000(位/吋);應用極限分別為<30,000(位/吋)、70,000(位/吋)、500,000(位/吋);面密度分別為 107 (位/吋2)、108(位/吋2)、109(位/吋2)。 從90年代發展起來的光儲存和磁光儲存的光碟,儲存密度高,可以達到(1010位/cm2), 使用壽命長(105次)並且具有高保真度,可以擦除。光碟的發展很快,目前已經普遍使用。磁光材料的早期應用非晶態GdCo,後來採用三元合金、過度族和稀土元素:GaTbFe,TbFeCo。採用Co和Pt的薄膜重疊可以獲得更好效果,其厚度分別只有4Å和10~20Å,需要用分子束外延的方法進行制備。 信息儲存-作用 信息的儲存市信息系統的重要方面,如果沒有信息儲存,就不能充分利用已收集、加工所得信息,同時還要耗資、耗人、耗物來組織信息的重新收集、加工。有了信息儲存,就可以保證隨用隨取,為單位信息的多功能利用創造條件,從而大大降低了費用。 優點:存取速度極快,存儲的數據量大 信息儲存-與漢字 信息時代的到來,更加突出了漢字的優越性。21世紀新的電腦將採用聲控系統,它將摒棄由字母編制的鍵盤,由於英語的英節多達10000 個以上,而漢語只有400 多音節,每個音節最多4 個音素,因由美國語言學家蓋利. 吉寧斯在《世界語言》一書中對漢語的簡潔性、准確性、嚴密性和先進性給予高度評價,認為正是中國人幾千年的努力,才把西文語法書里的種種麻煩拋個精光,最後只留下幾千個單字和若干條效率極高的排字規則。英國《新科技雜志》原主編,科技發明報道專家邁克.克魯斯斷言,不久的將來,漢語將充分發揮威力,到那時世界關於語言文字結構的研究中心有可能轉移到中國。在20世紀初年的中國,人們由於憤慨中國科學技術的落後,力圖擺脫文字的阻隔,向世界認同,曾經發出漢字拼音化的呼籲。曾幾何時,中國的漢字即以強勁的生命力證 明了它無窮的潛力。是電腦接受了漢字,而不是電腦改變了漢字。因此有人稱它為電腦文字,表明它是人類中具有最佳的信息交換應用程序的語種。 信息儲存-未來發展 從最早的磁帶機到今天的LTO,現代存儲技術已經走過了半個世紀。在IBM特別為此舉行的紀念活動中,專家們描述了未來智能化存儲的趨勢。 1952年,IBM推出了第一台磁帶機726。它使人類正式告別了使用打孔機存儲數據的方式。1962年激光二極體的發明,奠定了光讀寫的基礎。於是,20世紀60年代至70年代早期,掀起一股以增加功能、縮短服務時間、減少設備佔地面,以積簡化磁帶通路為目的的熱潮。1970年IBM發明的軟盤成為攜帶型存儲的中流砥柱。上個世紀末,虛擬磁帶伺服器的開發,極大地提高了數據共享能力和磁帶的效率。而世界上最小最輕的硬碟驅動器(microdrive)則為移動存儲的發展奠定了堅實的基礎。 當前,隨著互聯網及電子商務的應用發展,存儲在企業網路中的數據就成為企業最珍貴的資產,存儲已不再是附屬於伺服器的輔助備份設備,日益走向企業信息系統的核心。信息的有效存儲保護,備份和災難恢復已成為企業構建IT基礎設施迫切需要考慮的重要環節。 未來的存儲不僅具有更高的容量、速度和性能價格比,而且還將具有自恢復和自管理功能,同時具有高度的開放性和互操作性。
Ⅷ 語義信息的存儲
無論是知識庫還是服務的語義描述都需要具有良好的組織和存儲,以支持高效推理和服務檢索發現。目前對於本體的存儲方法基本有三種(李勇等,2008):
(1)純文本,如 OWL 文件。由於 XML 的信息組織和存儲方式結構復雜,而且存在冗餘等,基於其上的查詢檢索效率通常會比較低。純文本的方式適合本體比較小的時候,不適合本體大規模應用的情況。
(2)資料庫: 是一種比較好的持久化存儲方式,最大好處是便於查找,可存放大本體,查詢效率高,特別在 I/O 效率上。但是資料庫方式存在本體查詢語言到 SQL 的轉換問題,需要藉助於第三方中間件或自定義實現。
(3)專門的管理工具: 比如說 OMM(Ontology Middleware Mole)支持對 RDF、OWL 的存儲管理,還提供各種介面,可以使用查詢語言對 RDF 或者 OWL 進行查詢。綜合對比這三種本體存儲方式,由於關系資料庫存儲幾十年的技術積累,以及它的海量存儲特點而成為了許多研究者的首選。
5.4.3.1 本體的關系資料庫存儲模式
由於本體模型和關系模型的差異,目前存在多種在關系模型中存儲本體的方法,其主要可以分為以下四類(陶皖等,2007; 陳光儀,2009)。
5.4.3.1.1 水平模式
該模式只在資料庫中保留一張通用表,表中列為本體中的屬性。整個本體庫中定義了多少個屬性,這張表就有多少個列,具體如圖 5.28 所示。本體中的每個實例對應該表中的一條記錄。這種存儲模式結構簡單,執行查詢操作比較方便。但是該通用表包含了大量的列,而現有的資料庫系統對一張表中列的個數都是有限制的,所以該模式無法存儲規模較大的本體。而且表中的數據過於稀疏。由於每個實例對應關系表中的一行,如果其在某些屬性列上沒有值,那麼必須將對應的屬性值設置為空,這將導致大量空欄位的出現,不僅浪費存儲空間,而且增加了索引維護的代價。另外該通用表中一個實例的屬性和屬性值只能是一對一,而實際情況往往是一對多,因此無法存儲具有這種特徵的本體。隨著應用中本體的進化,還需要時常更新通用表中的列,重新組織表結構,這將耗費極大的系統代價。
圖 5.28 水平存儲模式
5.4.3.1.2 垂直模式
垂直模式包含一張三元組表,表中的每條記錄都對應一個 RDF 三元組(主語,謂詞,賓語),具體如圖 5.29 所示。因此這種模式下,需要將本體中的所有信息都以 RDF 三元組的形式表示出來。Protege(2002)中便是使用了這種存儲模式將本體存儲於資料庫中。這種模式設計簡單,並且結構穩定。如果本體進行了更新,只需修改表中相應的元組即可。另外,該模式通用性好,因為現有的本體模型都可以轉換為 RDF 模型表示。但是這種模式的可讀性較差,若對本體信息進行查詢,那麼設計對應的 SQL 語句比較麻煩。除此之外,由於所有信息都存放在三元組表中,導致任何一個本體信息查詢都必須遍歷整個數據表,特別是那些需要進行表連接的查詢,使得查詢效率非常低,這是這種模式最大的不足之處。
圖 5.29 垂直存儲模式
5.4.3.1.3 分解模式
該模式與水平模式和垂直模式的一個顯著的區別是它使用了若干張表,其基本思想是將資料庫進行模式分解。根據分解的對象不同,現有的採用分解模式的方法有兩種。①基於類的分解模式,即為本體中的每個類都創建一張單獨的表,表名為類名,表的列為類的屬性,具體如圖 5.30 所示。這種模式結構清晰,但是很難適應本體動態變化的情況,因為隨著本體中類或者屬性的變化,表結構都要隨著變化。②基於屬性的分解模式,即為本體中的每個屬性創建一張單獨的表,表名為屬性名,每個表都包含兩個列,分別代表RDF 三元組中的主語和賓語,具體如圖 5.31 所示。在該模式中對類的隱含實例的查詢代價很大,而且在現有的這兩種分解模式的方法中,隨著本體的變化都要不斷的創建和刪除表,而在資料庫系統中創建和刪除表的效率很低。
圖 5.30 按類分解模式
圖 5.31 按屬性分解模式
5.4.3.1.4 混合模式
該模式通常將上述幾種模式進行混合使用。例如,Pan 等(2003)提出這樣一種將基於類的分解模式與基於屬性的分解模式混合的存儲模式,即在本體中定義一個類就為該類創建一個表(創建方法類似於基於類的分解模式),在本體中定義一個屬性就為該屬性創建一個表(創建方法類似於基於屬性的分解模式)。然而,與基於類的分解模式不同的是,該混合模式在類對應的表中不記錄相應實例的所有信息,而只記錄實例的 ID。實例在各個屬性上的取值則分別記錄在各屬性對應的表中,所以和基於屬性的分解模式類似,該模式在屬性對應的表中仍然需要兩列: 主語和賓語。對於本體類數目不多的情況下,這種模式在簡單檢索的情況下,運行得很好。但是,如果本體的類比較多,這種方式就會存在一些問題,例如: 資料庫無法容納這么多表,或者效率低下。
針對上述四種模式,陳光儀(2009)從四個方面對適用場合、查詢和更新效率、結構清晰以及易理解性、可擴展性四個方面對他們進行了綜合對比(表 5.4):
表 5.4 不同存儲模式的綜合對比
(修改自陳光儀,2009)
通過上述對本體存儲模式的闡述及之間的綜合對比發現,本體存儲模式除了應該具有盡量高的規范化程度(例如滿足第三範式或 BCNF 范圍等),還應該滿足以下三個原則。
(1)模式結構易於理解。該原則是為了便於本體查詢的實現。如果模式結構不直觀,會給查詢語句的設計帶來困難。例如,垂直模式不滿足該要求,它將所有的信息都採用三元組的形式存儲在一張表中,不容易理解表中元組的含義,加重了本體查詢設計的負擔。
(2)模式結構穩定。即本體的變化不會引起資料庫表結構的變化。因為本體是不斷進化的,如果設計的模式結構會隨著本體的變化而變化,資料庫系統對其維護代價太大。現有的水平模式、分解模式和混合模式都不滿足該要求。
(3)查詢效率高。該原則是評價各種存儲模式的一個重要指標。因為本體中不僅包含大量的數據,而且查詢中還經常需要進行表連接。例如在現有的垂直模式和基於屬性的分解模式中,那些涉及表連接的查詢效率非常低。
目前在基於資料庫的本體存儲的實踐上,一些學者開展了相關的研究工作:
燕雲鵬(2007)和陳光儀(2009)提出了類似的針對於針對 OWL 的本體資料庫的混合本體存儲模式(圖 5.32,5.33)。可以看出這種模式是以基於屬性的分解模式與垂直模式的混合體,具有較好的擴展性。但是存在的問題是效率不夠高,所有的類存儲在一個表中,所有的實例也存儲在一個表中,這種方式的檢索效率比較低。另外存儲實例的表(Instance,Proterty,Value)中欄位 Value 必須存儲許多種不同類型的數值,比如有的是文本型,而有的卻是數值型,使得數據不夠清晰。此外,在針對幾何體這種復雜的地理對象,這種欄位就比較難以存儲。
圖 5.32 本體的資料庫混合存儲模式(據燕雲鵬,2007)
ebRIM(ebXML Registry Information Model)是一個主流的信息注冊模型,已成為事實上的標准,得到了 OGC 等支持。OGC 已經實現了基於 ebRIM 的目錄服務,並推薦其作為目錄服務的實現規范。但是目前基於 ebRIM 的目錄服務只支持普通的基於關鍵字的檢索。為此,一些學者已經開始研究如何擴展 ebRIM 實現對語義信息特別是 OWL 的注冊。Dogac 等(2004)提出了如圖 5.34 所示的一種通過將 XML 形式存儲的 OWL 文件轉換為以資料庫形式存儲,使得查詢檢索更加快速,管理維護也更加方便。為了能在 ebRIM 存儲復雜的地理空間信息對象,一些學者開展了基於 ebRIM 的地理擴展方面的研究工作。樂鵬(2007)在其論文中提出了兩種擴展方式: ① 從類 「ExtrinsicObject」 派生了「CSWExtrinsicObject」來描述那些不是 ebRIM 自身定義的元數據對象。比如類 「Dataset」繼承了 「CSWExtrinsicObject」來描述空間數據集。②對 ebRIM 已有的類別增加 「Slot」。每一個從 「RegistryObject」繼承下來的類均允許添加 「Slot」。ebRIM 中的 「Service」類可以用來描述空間服務,但是已有的屬性不足以描述空間網路服務。因此,通過添加「Slot」到 「Service」類中以定義從 ISO 19119 派生的屬性。如圖 5.35 所示為經擴展後的ebRIM 高層模型圖,其中 灰 色 填 充 的 矩 形 框表示 擴 展 的對 象 類。該 模 式 與 前 面 燕 雲 鵬(2007)和陳光儀(2009)提出的模式相比,本質上差別不大,也是以基於屬性的分解模式與垂直模式的混合體,只不過是基於標準的 ebRIM 注冊模型,並且將其中的分類系統相關的類單獨以兩張表存儲。該模式也具有很好的擴展性,也存在同樣的一些問題。
圖 5.33 本體的資料庫混合存儲模式(據陳光儀,2009)
海洋信息網格技術與應用
續表
5.34 OWL 元素到 ebRIM 元素的映射(Dogac et al.,2004)
5.4.3.2 基於多分解策略的混合存儲模式實現
對知識庫以及服務語義注冊信息的存儲的實現上,本書在現有的研究成果的基礎上,結合本體組織構成及特點等實際需求,提出了一種基於多分解策略的混合關系資料庫存儲模式。
該方法的指導思想是: 先按類對其中的數據專題、數據模式、處理模型等進行類的分解,然後結合屬性的特性進行基於屬性的分解。其中基於類的分解中,可能粒度的大小不一,可能是一個類或者具有相關或相似的一些類劃分為一張表存儲; 而基於屬性的剖分,也並不是所有具有該屬性的類以一個表存儲,而可能是只針對一個類也單獨組織為一張表,其具體思路如下:
圖 5.35 經擴展的 ebRIM 高層模型圖(據樂鵬,2007)
(1)類的分解: 因為本研究的存儲模型不是為了實現一個通用的本體存儲模型,而是為了實現一個服務於海洋信息服務領域的本體存儲模型。海洋信息服務領域必然會牽涉到一些對象,比如對服務、模型、參數等對象,並且對這些對象的認識也基本上確定(也就是說這些對象類所具有的屬性及之間的關系基本明確),所以沒必要像上面幾種實現方案那樣因為不能預知都有哪些類,各類都有哪些屬性而將所有的實例的組織按垂直方式進行存儲,也沒有必要有一些表(比如獨立的屬性表,屬性的作用域和值域表等); 而有必要針對海洋信息服務領域內的這些類的信息內容獨立出一些表: 對於海洋專題,地理名實體、處理模型、數據模式等海洋信息檢索發現中常用的對象,則有必要進行分開存儲,否則必然使得結構不清晰,且檢索查詢效率低。
(2)對於專題、空間形態以及模型功效等只是簡單的分類系統,所具有的屬性少,而且今後存在派生新的種類的可能,因此必須具備一定的擴展性。針對這類數據。它們的存儲方式是(ClassID,ParentClassID,ClassType),其中 ClassType 標注本體類是屬於專題(比如 「海流」)或者其他。
(3)對於取值不唯一的屬性,且大部分類或實例都具有的屬性,則採用基於屬性的分解模式。比如對於別名屬性(hasAliasName),有可能一個類實例具有多個別名,這種情況下,則採取基於屬性的組織方式。該表的形式是:(OntologyID,AliasName),其中OntologyID 可以是本體類的 ID,也可以是本體實例的 ID,還可以是本體屬性的 ID,因為類、實例和屬性都可以有別名。
(4)對於復雜的屬性,採取大二進制存儲的方式。比如對於地名實例的空間覆蓋范圍,則不考慮其實際內部是包含多少個組成部分,統一按一個 shape 存儲在資料庫中。當然這里藉助了 ArcGIS 的 GDB 的 FeatureClass 矢量數據模型,並對於不同空間形態的則採用了多張表(點狀地名類、線狀地名類、面狀地名類),其組織方式是(GeoNameObjec-tID,shape)。同樣,對於模型本體中的內部流程本體,也採用了大二進制方式存儲,將整個流程 XML 描述文件,作為一個整體存放於欄位中,其大體組織方式為(ModelID,FlowXML)。
(5)本研究採用 ArcGIS 的 GeoDatabase 作為存儲模型。本體類(ontClass)的存儲結構如圖 5.36 所示,資料庫的總體組織結構如圖 5.37 所示。
圖 5.36 本體類(onClass)的存儲結構
Ⅸ 《信息組織與存儲》切分標題法的過程及原理
這類方法典型代表是非用字後綴法。此方法按照不同的用途將字機械地分成四個類別:(A)
表外用字(B)表內用字(C)條件用字 (D)非用字。
這種方法標引的基本過程如下:(1)計算機掃描輸入的漢字串,逐字與「非用字後綴表」種的字進行比較,如果是非用字,則捨去;如果是用字(報考表外用字、表內用字和條件用字),則取出。(2)在抽取的字元串中沒有非用字,各種情況都將是A,B,C三類字的不同組合與排列,在加以合並整理並考慮到構詞的一般規律,擬定了六種構詞模式。根據漢字類型,參照規定的六種構詞模式,將取出的漢字串分解成單詞或專用片語。(3)對最終抽出的詞進行諸如按字長選擇、單字處理及優先切分等規則的處理,最後確定標引詞。