1. 資料庫的發展簡史
資料庫技術是本世紀60年代開始興起的一門信息管理自動化的新興學科,是計算機科學中的一個重要分支。隨著計算機應用的不斷發展,在計算機應用領域中,數據處理越來越佔主導
地位,資料庫技術的應用也越來越廣泛。
資料庫是數據管理的產物。數據管理是資料庫的核心任務,內容包括對數據的分類、組織、編碼、儲存、檢索和維護。隨著計算機硬體和軟體的發展,資料庫技術也不斷地發展。從數據管理的角度看,資料庫技術到目前共經歷了人工管理階段、文件系統階段和資料庫系統階段。
A.人工管理階段
人工管理階段是指計算機誕生的初期(即20世紀50年代後期之前),這個時期的計算機主要用於科學計算。從硬體看,沒有磁碟等直接存取的存儲設備;從軟體看,沒有操作系統和管理數據的軟體,數據處理方式是批處理。
這個時期數據管理的特點是:
1. 數據不保存
該時期的計算機主要應用於科學計算,一般不需要將數據長期保存,只是在計算某一課題 時將數據輸入,用完後不保存原始數據,也不保存計算結果。
2. 沒有對數據進行管理的軟體系統
程序員不僅要規定數據的邏輯結構,而且還要在程序中設計物理結構,包括存儲結構、存取方法、輸入輸出方式等。因此程序中存取數據的子程序隨著存儲的改變而改變,數據與程序不具有一致性。
3. 沒有文件的概念
數據的組織方式必須由程序員自行設計。
4. 一組數據對應於一個程序,數據是面向應用的
即使兩個程序用到相同的數據,也必須各自定義、各自組織,數據無法共享、無法相互利用和互相參照,從而導致程序和程序之間有大量重復的數據。
B.文件系統階段
文件系統階段是指計算機不僅用於科學計算,而且還大量用於管理數據的階段(從50年代後期到60年代中期)。在硬體方面,外存儲器有了磁碟、磁鼓等直接存取的存儲設備。在軟體方面,操作系統中已經有了專門用於管理數據的軟體,稱為文件系統。
這個時期數據管理的特點是:
1. 數據需要長期保存在外存上供反復使用
由於計算機大量用於數據處理,經常對文件進行查詢、修改、插入和刪除等操作,所以數據需要長期保留,以便於反復操作。
2. 程序之間有了一定的獨立性
操作系統提供了文件管理功能和訪問文件的存取方法,程序和數據之間有了數據存取的介面,程序可以通過文件名和數據打交道,不必再尋找數據的物理存放位置,至此,數據有了物理結構和邏輯結構的區別,但此時程序和數據之間的獨立性尚還不充分。
3. 文件的形式已經多樣化
由於已經有了直接存取的存儲設備,文件也就不再局限於順序文件,還有了索引文件、鏈表文件等,因而,對文件的訪問可以是順序訪問,也可以是直接訪問。
4. 數據的存取基本上以記錄為單位
2. 世界上的三大文獻檢索資料庫是哪幾個
世界上的三大文獻檢索資料庫是SCI(科學引文索引 )、EI(工程索引 )、ISTP(科技會議錄索引 ) 。
1、SCI即《科學引文索引》(Science Citation Index),是由美國科學信息研究所(Institute for Scientific Information 簡稱ISI)創建的,收錄文獻的作者、題目、源期刊、摘要、關鍵詞,不僅可以從文獻引證的角度評估文章的學術價值,還可以迅速方便地組建研究課題的參考文獻網路。
SCI創刊於1961年。經過40年的發展完善,已從開始時單一的印刷型發展成為功能強大的電子化、集成化、網路化的大型多學科、綜合性檢索系統。--
2、EI是美國《工程索引》(The Engineering Index)的簡稱。EI創刊於1884年,由美國工程情報公司(Engineering Information Co.)出版發行。
EI是工程技術領域內的一部綜合性檢索工具,報道內容包括:電類、自動控制類、動力、機械、儀表、材料科學、農業、生物工程、數理、醫學、化工、食品、計算機、能源、地質、環境等學科。
3、ISTP是Index to Scientific & Technical Proceedings的縮寫,是美國科學情報研究所的網路資料庫Web of Science Proceedings中兩個資料庫(ISTP和ISSHP)之一。
專門收錄世界各種重要的自然科學及技術方面的會議,包括一般性會議、座談會、研究會、討論會、發表會等的會議文獻,涉及學科基本與SCI相同。
重視程度:
在國際科學界,如何正確評價基礎科學研究成果已引起越來越廣泛的關注。而被SCI、SSCI收錄的科技論文的多寡則被看作衡量一個國家的基礎科學研究水平、科技實力和科技論文水平高低的重要評價指標。
在ISTP、 EI、 SCI這三大檢索系統中,SCI最能反映基礎學科研究水平和論文質量,該檢索系統收錄的科技期刊比較全面,可以說它是集中各個學科高質優秀論文的精粹,該檢索系統歷來成為世界科技界密切注視的中心和焦點。
以上內容參考:網路——三大檢索
3. 傳統的資料庫模型有哪三種他們各自的有缺點是什麼
關系模型、網狀模型、層次模型
1、關系模型的缺點是查詢效率不如非關系模型。因此,為了提高性能,必須對用戶的查詢進行優化,增加了開發資料庫管理系統的負擔。
2、網狀模型的缺點是結構比較復雜,而且隨著應用環境的擴大,資料庫的結構就變得越來越復雜,不利於最終用戶掌握。
第二,其DDL,DML語言復雜,用戶不容易使用。用於記錄之間聯系是通過存取路徑實現的,應用程序訪問資料庫時必須選擇適當的存取路徑。因此,用戶必須了解系統的結構的細節,加重了編寫應用程序的負擔。
3、層次模型的缺點
現實世界中很多聯系是非層次性的,如多對多聯系,一個節點具有多個雙親等,層次模型不能自然的表示這類聯系,只能通過引入冗餘數據或引入虛擬結點來解決
對插入和刪除操作的限制比較多
查詢子女結點必須通過雙親結點
(3)世界傳統資料庫擴展閱讀:
層次模型的優點
1、模型簡單,對具有一對多層次關系的部門描述非常自然,直觀,容易理解,這是層次資料庫的突出優點
2、用層次模型的應用系統性能好,特別是對於那些實體間聯系固定的且預先定義好的應用,採用層次模型來實現,其性能優於關系模型
3、層次數據模型提供了良好的完整性支持。
4. 五個常見的資料庫
五個常見的資料庫分別為:Mysql、SQLServer、Oracle、Sybase、DB2。
1、資料庫定義:資料庫,又稱為數據管理系統,簡而言之可視為電子化的文件櫃——存儲電子文件的處所,用戶可以對文件中的資料執行新增、截取、更新、刪除等操作。它是以一定方式儲存在一起、能與多個用戶共享、具有盡可能小的冗餘度、與應用程序彼此獨立的數據集合。一個資料庫由多個表空間構成。
2、MySQL資料庫:原本是一個開放源碼的關系資料庫管理系統,原開發者為瑞典的MySQLAB公司,該公司於2008年被_陽微系統收購。2009年,甲骨文公司(Oracle)收購_陽微系統公司,MySQL成為Oracle旗下產品。MySQL在過去由於性能高、成本低、可靠性好,已經成為最流行的開源資料庫,因此被廣泛地應用在Internet上的中小型網站中。隨著MySQL的不斷成熟,它也逐漸用於更多大規模網站和應用。
3、SQLServer:SQLServer資料庫是Microsoft開發設計的一個關系資料庫智能管理系統(RDBMS),現在是全世界主流資料庫之一;SQLServer資料庫具備方便使用、可伸縮性好、相關軟體集成程度高等優勢,能夠從單一的筆記本上運行或以高倍雲伺服器集群為基礎,或在這兩者之間任何東西上運行。
5. 資料庫都有哪些啊
大型的:db2、oracle、sybase等
網路的:sql 等
小型的:fox系列FOXBASE/FOXPRO/VFP等
簡易的:ACCESS等
6. 常用的資料庫有哪些
1. IBM 的DB2
作為關系資料庫領域的開拓者和領航人,IBM在1997年完成了System R系統的原型,1980年開始提供集成的資料庫伺服器—— System/38,隨後是SQL/DSforVSE和VM,其初始版本與SystemR研究原型密切相關。DB2 forMVSV1 在1983年推出。該版本的目標是提供這一新方案所承諾的簡單性,數據不相關性和用戶生產率。1988年DB2 for MVS 提供了強大的在線事務處理(OLTP)支持,1989 年和1993 年分別以遠程工作單元和分布式工作單元實現了分布式資料庫支持。最近推出的DB2 Universal Database 6.1則是通用資料庫的典範,是第一個具備網上功能的多媒體關系資料庫管理系統,支持包括Linux在內的一系列平台。
2. Oracle
Oracle 前身叫SDL,由Larry Ellison 和另兩個編程人員在1977創辦,他們開發了自己的拳頭產品,在市場上大量銷售,1979 年,Oracle公司引入了第一個商用SQL 關系資料庫管理系統。Oracle公司是最早開發關系資料庫的廠商之一,其產品支持最廣泛的操作系統平台。目前Oracle關系資料庫產品的市場佔有率名列前茅。
3. Informix
Informix在1980年成立,目的是為Unix等開放操作系統提供專業的關系型資料庫產品。公司的名稱Informix便是取自Information 和Unix的結合。Informix第一個真正支持SQL語言的關系資料庫產品是Informix SE(StandardEngine)。InformixSE是在當時的微機Unix環境下主要的資料庫產品。它也是第一個被移植到Linux上的商業資料庫產品。
4. Sybase
Sybase公司成立於1984年,公司名稱「Sybase」取自「system」和 「database」 相結合的含義。Sybase公司的創始人之一Bob Epstein 是Ingres 大學版(與System/R同時期的關系資料庫模型產品)的主要設計人員。公司的第一個關系資料庫產品是1987年5月推出的SybaseSQLServer1.0。Sybase首先提出Client/Server 資料庫體系結構的思想,並率先在Sybase SQLServer 中實現。
5. SQL Server
1987 年,微軟和 IBM合作開發完成OS/2,IBM 在其銷售的OS/2 ExtendedEdition 系統中綁定了OS/2Database Manager,而微軟產品線中尚缺少資料庫產品。為此,微軟將目光投向Sybase,同Sybase 簽訂了合作協議,使用Sybase的技術開發基於OS/2平台的關系型資料庫。1989年,微軟發布了SQL Server 1.0 版。
6.PostgreSQL
PostgreSQL 是一種特性非常齊全的自由軟體的對象——關系性資料庫管理系統(ORDBMS),它的很多特性是當今許多商業資料庫的前身。PostgreSQL最早開始於BSD的Ingres項目。PostgreSQL 的特性覆蓋了SQL-2/SQL-92和SQL-3。首先,它包括了可以說是目前世界上最豐富的數據類型的支持;其次,目前PostgreSQL 是唯一支持事務、子查詢、多版本並行控制系統、數據完整性檢查等特性的唯一的一種自由軟體的資料庫管理系統.
7.mySQL
mySQL是一個小型關系型資料庫管理系統,開發者為瑞典MySQL AB公司。在2008年1月16號被Sun公司收購。目前MySQL被廣泛地應用在Internet上的中小型網站中。由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網站為了降低網站總體擁有成本而選擇了MySQL作為網站資料庫。MySQL的官方網站的網址是: www.mysql.com
7. 傳統資料庫系統的幾個層次
傳統的資料庫系統分為3個層次,按ANSI的定義分別為物理模式、概念模式和外部模式。傳統的資料庫採用這種層次結構是因它所管理的數據而決定的。在這種資料庫中,數據主要是抽象化的字元和數值,管理和操縱的技術也是簡單的比較、排序、查找和增刪改等操作,處理起來容易,也比較好管理。
最低層也就是第一層,稱為媒體支持層,第二層稱為存取與存儲數據模型進行描述。第三層稱為概念數據模型層,是對現實世界用多媒體數據信息進行的描述,也是多媒體資料庫中在全局概念下的一個整體視圖。第四層稱為多媒體用戶介面層,完成用戶對多媒體信息的查詢描述和得到多媒體信息的查詢結果。
8. 資料庫有哪些
目前比較常見的資料庫:
SQL是用於訪問和處理資料庫的標準的計算機語言。
MySQL是小型的開源的關系型資料庫管理系統。
SQL Server 是 Microsoft 開發的關系資料庫管理系統。
Oracle資料庫系統是目前世界上流行的關系資料庫管理系統。
DB2是關系型資料庫平台,其採用多進程多線索的結構,支持多用戶或應用程序在同一條SQL 語句中查詢不同資料庫和數據。
PostgreSQL 是一個對象-關系資料庫伺服器,號稱 "世界上最先進的開源關系型資料庫"。
Hadoop是個很流行的分布式計算解決方案,Hive是基於hadoop的數據倉庫工具,hive 構建在基於靜態批處理的Hadoop 之上。
GreenPlum採用了MPP(大規模並行處理),是一個由多個獨立的資料庫服務組合成關系型資料庫集群。
ECharts 是一個使用 JavaScript 實現的開源可視化庫,涵蓋各行業圖表。
R是一種集統計分析與圖形顯示為一體的統計分析軟體,具有很強的互動性。
python是一種跨平台的計算機程序設計語言,被廣泛用於系統管理任務的處理和Web編程。
目前,這些資料庫都在樹懶學堂有相關教程,可以跟著一步一步學習
9. 大數據和傳統資料庫的區別是什麼
他的區別有8種:
分別是:
1、數據規模、2、數據類型、3.模式(Schema)和數據的關系、4.處理對象
5、獲取方式、6、傳輸方式、7、數據存儲方面、8、價值的不可估量
價值的不可估量:
傳統數據的價值體現在信息傳遞與表徵,是對現象的描述與反饋,讓人通過數據去了解數據。
而大數據是對現象發生過程的全記錄,通過數據不僅能夠了解對象,還能分析對象,掌握對象運作的規律,挖掘對象內部的結構與特點,甚至能了解對象自己都不知道的信息。
10. 資料庫都有哪些
常用資料庫有mysql、oracle、sqlserver、sqlite等。mysql性能較好,適用於所有平台,是當前最流行的關系型資料庫之一。sqlserver資料庫具有擴展性和可維護性,且安全性較高,是比較全面的資料庫。