⑴ csmar資料庫中的行業如何劃分為十三個行業
「CSMAR財經資料庫」是由深圳市國泰安信息技術有限公司開發。CSMAR系列研究資料庫是國泰安公司根據國際資料庫標准(CRSP和COMPUSTAT)開發的專門針對中國金融、經濟領域的研究型精準資料庫,包括股票市場、公司研究、基金市場、債券市場、衍生市場、經濟研究、行業研究、海外研究和專題研究等11大系列,75個資料庫。
是全面涵蓋中國經濟、金融主要領域的高精準研究型資料庫,能滿足不同研究者的需求,幫助研究者最快和最方便的構建研究模型。
⑵ 2022年國內主流醫葯資料庫有哪些
目前主要使用的醫葯資料庫分為兩大類,一個是免費醫葯資料庫,一個是商業綜合類的醫葯資料庫。醫葯資料庫的本質是讓用戶能在短時間內在一個網站把想要的信息通過檢索一覽無余,因此,全面性、准確性、及時性是該類資料庫的主要指標。
先說免費醫葯資料庫,大大小小的比較多,但真正用戶量大,達到一定使用頻率的,我們在此推薦三個最全面的:
①:DrugBank資料庫,它是加拿大阿爾伯塔大學(University of Alberta)研究人員將詳細的葯物數據和全面的葯物目標信息結合起來,建立的真實可靠的生物信息學和化學信息學資料庫。DrugBank包含50萬種葯物信息,其中包括2653種經批準的小分子葯物、1417種經批準的生物技術(蛋白質/肽)葯物、131種營養品和6451種實驗葯物。
②:pharnexcloud,他目前是開放程度高的中文界面醫葯資料庫,包含了全球葯品研發管線、審評審批進度、全球臨床試驗、中國臨床試驗、葯品招投標、集采、一致性評價等大量整合信息。
③:ClinicalTrials,它是一個基於網路的資源,為患者、他們的家庭成員、醫療保健專業人員、研究人員和公眾提供了方便地訪問關於各種疾病和病症的公共和私人支持的臨床研究的信息。該網站由 美國國立衛生研究院的國家醫學圖書館(NLM) 維護(NIH),美國國家醫學圖書館提供的資源,探索所有 50 個州和 221 個國家/地區的 422,494 項研究。註:所有資料及相關研究僅供參考,未取得相關政府機構評定。
免費資料庫涉及數據層面的關聯性相對單一、數據深度存在一定局限性,畢竟這類資料庫沒有像商業資料庫那樣花上足夠多的人力成本及時間成本去清洗、整理、維護數據。
商業類醫葯資料庫往往是高價值資料庫的代表。商業類醫葯資料庫特點是功能強大不僅能對學術類信息加以融合處理,還能分析葯品全生命周期數據,競品葯品銷售詳細情況、競品企業招投標、投融資、集中采購信息等;除此之外還能實時跟蹤產品管線最新信息,做到實時調整戰略方向,防止做無用功浪費企業資源。現在商業類資料庫可以說是醫葯企業必備的資料庫。筆者就國內葯企主要使用的商業醫葯資料庫(同時對比兩個國外資料庫)給大家一一列舉。
葯融雲企業版Pharnexcloud
數據全面性:★★★★★
運營企業:葯融雲數字科技
上線時間:2020年
資料庫數量:218個
產品組成:葯物研發庫群、上市葯品庫群、葯品銷售庫群、市場信息庫群、一致性評價庫群、原料葯庫群、醫療器械庫群、生產檢驗庫群、合理用葯庫群、醫葯文獻等十個版塊構成。
數據來源:各國葯品監管機構、試驗研究、學術會議報告、文獻期刊、異構資源、企業公告各國衛生機構、醫學新聞雜志、網路資訊、專利、協會學會等。
數據特色:數據採集近80個主流國家,監控全球10萬+醫葯數據信息源,數據放大模型演算法涉及人口學、經濟學、發病率、醫療資源分布等各類特徵參數。
增值服務:①專人對接需求,團隊解決問題。②沙龍、巡講、峰會、項目交易、需求對接等活動支持,能加入他們葯融圈生態鏈。
優點:全面覆蓋醫葯領域全產業鏈各環節,數據總量大、數據來源、專業報告、數據演算法、結果展示都做得非常好。
缺點:相比較於全球頂尖的cortellis、informa等,pharnexcloud的數據展示結果關聯性還有明顯的進步空間。
pharnexcloud醫葯資料庫後來居上,進步很快,近年來逐步成為國內醫葯企業選擇較多的醫葯資料庫,因其產品功能的全面和數據全面性得到越來越多的認可,希望能保持這個進步速度。
葯智
綜合性推薦指數:★★★★☆
運營企業:重慶康洲數據
上線時間:2009年
產品組成:由研發、一致性、生產、上市、市場、用葯、葯化、中葯材、器械等九個版塊組成。
數據來源:地區機構、資訊、企業公告報道、醫療會議、公司年度報告、醫療衛生機構、醫學雜志、專利、商標、技術實施文件、學術會議、技術報告、科技期刊等。
資料庫數量:172個
檢索方式、功能點、底層數據架構、界面展示:與insight、Pharnexcloud資料庫大體一致。
優點:葯物綜合報告、審評、臨床數據都做得相當不錯。而且僅此一家推出了化妝品、食品資料庫。
缺點:葯品銷售數據起步階段暫不夠成熟,全球數據相對量少。(葯品銷售數據對於葯品的立項調研、競品銷售分析、銷售戰略目標制定都是重中之重)。創新葯物收錄數量有待提高。
醫葯魔方
綜合推薦指數:★★★★☆
運營企業:北京華彬立成
上線時間:2013年
資料庫數量:49個
產品組成:資本透視、全球新葯、全球臨床、基礎數據、市場洞察這五個版塊構成。
數據來源:實驗室研究、內部會議、專業報道、專利、商標、技術實施文件、學術會議、技術報告、科技期刊、文獻、教科書、地區機構、資訊、新聞資訊、公司年度報告等。
產品亮點:資本透視和創新葯物版塊做得非常不錯,在該領域都屬於行業佼佼者。
收費:單價在國內偏高
優點:投融資版塊、可視化疾病圖譜和靶點整合、審評、臨床等數據做充分關聯、新上線的NextMed板塊有一定領先性、其投融資版塊做得很好。
缺點:總體數據數量偏少,葯物研發也只解讀了3萬多個葯物,比較同類產品丟失部分功能版塊,全球數據不夠豐富。銷售數據模塊雖然有,但十分封閉,無任何宣傳,對其具體情況業內不了解。
醫葯魔方作為創新葯物和醫葯投融資資料庫目前國內用戶沉積多的資料庫之一,但其產品功能過於封閉,已成自己的圍牆。
葯渡
綜合推薦指數:★★★☆
運營企業:葯渡經緯信息科技
上線時間:2013年
資料庫數量:132個
產品組成:由全球葯物、全球器械、投資生態、臨床研究、專利文獻、政策法規、世界葯問、數據定製八個版塊構成。
數據來源:實驗室研究、內部會議、專業報道、專利、商標、技術實施文件、學術會議、技術報告、科技期刊、在線資料庫、在線辭典、電子書庫、地區機構、資訊、企業公告報道、醫療會議等。
優點:其葯物研發信息與國內審評、臨床等多個庫均有不錯的關聯,層級結構、標簽及界面都做得相當不錯。對生物葯、化學葯等細微標簽做了單獨優化。
缺點:目前沒有葯品銷售數據,臨床、上市葯品分析等數據採集方面比較弱,總體數據量在業內偏弱。
葯渡作為國內老牌醫葯資料庫之一以全球研發數據為核心,重點發展咨詢業務。缺少銷售數據其核心版塊數據,導致其數據業務只是一直低價在為其咨詢業務做支撐。
米內
綜合推薦指數:★★★★☆
運營企業:廣州標點醫葯信息
上線時間:2010年
資料庫數量:72個
產品組成:葯品銷售(多層格局,醫院、零售)、審評進度、上市葯品、臨床試驗、中標數據、全球新葯研發、全球專利、項目進度這個七個版塊構成
產品特色:國內葯品銷售數據領頭企業,其醫院銷售數據以「三大終端六大市場」為基礎,分層抽樣多等級醫院放大至全國。城市公立醫院、縣級公立醫院、實體葯店、網上葯店、城市社區衛生中心、鄉鎮衛生院等各類維度齊備。
優點:南方所背景,醫院銷售數據演算法和研發數據都做得非常不錯。六大格局在國內首屈一指。近期上線了獨家的電商類數據,雖然業界還在爭議電商數據可信度,但畢竟先走出了這一步。
缺點:全面性比較弱,銷售數據以外的全球數據、研發數據、審批數據相對重視程度很低,版本一直沒有大的進展。
米內醫葯資料庫南方所背景其醫院銷售版塊覆蓋面最廣之一,但其它版塊相對薄弱。
丁香園Insight
綜合推薦指數:★★★☆
運營企業:杭州觀瀾網路
上線時間:2013年Insight(2006年總部)
產品組成:臨床試驗、申報進度、葯品庫、上市產品、制葯企業、招投標、一致性評價、醫葯新聞、生物製品、全球數據等十個版塊構成。
數據來源:內部會議、專業報道、專利、商標、在線資料庫、在線詞典、電子書庫、異構資源共享平台、知識庫、地區機構、資訊、企業公告報道、醫療會議、新聞資訊等。
產品特色:其界面小功能開發豐富特別是小圖標的應用在國內UI設計上是好的,區別於同類產品。
檢索方式、功能點、底層數據架構、界面展示:與葯智資料庫大體一致。
優點:搜索體驗、UI界面小功能、時間軸、注冊數據、國內葯物審評、上市批文這些國內數據中做得非常不錯。
缺點:市場和銷售相關數據涉及較少,全球研發數據處於剛起步階段(全球葯物研發數據對於葯企來說十分重要可謂是醫葯行業的風向標,在全球葯物格局、葯物立項調研、企業發展戰略方向制定方面的重要性不言而喻)
Insight作為老牌醫葯資料庫的典型代表,背靠丁香園集團的大樹,目前國內用戶沉積多的資料庫之一,但因其葯物研發數據版塊、葯品市場與銷售數據起步晚,影響了其總體優勢。
上海醫工院PDB
綜合推薦指數:★★★
運營企業:上海數圖健康醫葯科技
上線時間:2011年
資料庫數量:31個
產品組成:分為葯物綜合和新葯研發監測兩個資料庫;葯物綜合資料庫包含了國內市場、細分市場、全球市場、國內工業生產、企業經濟運行五個版塊;新葯研發監測資料庫包含了全球研發、中國研發、一致性評價、企業競爭,品種篩選分析五個版塊。
數據來源:專利、商標、技術實施文件、學術會議、技術報告、科技期刊、文獻、教科書、地區機構、資訊、新聞資訊、公司年度報告、pjb等。
優點:工信部背景知名度高國產醫葯資料庫鼻祖,審評、臨床等數據有不錯的關聯展示;新上線的RPDB零售板塊有明顯的優勢提升;RAS醫葯處方分析系統具備一定獨家性。
缺點:數據全面性相對不高,部分工業類數據更新較慢,UI設計過於傳統。PDB作為全國老牌醫葯資料庫之一,全球葯物研發數據採集處於起步階段,也許是底層架構設計問題單開了一個CPM(新葯研發監測資料庫)導致其部分關聯性較差。
科睿唯安cortellis
綜合推薦指數:★★★★☆
產品組成:Cortellis 資料庫包含Cortellis競爭情報、Cortellis早期葯物發現、CMC、仿製葯、原料葯、系統生物學Metacore等等多個模塊,主要由競爭信息、疾病簡報、監管信息、新聞、葯物發現信息這幾個版塊構成;
數據來源:各大葯品監管機構、新聞雜志、網路資訊、文獻期刊、學術報告、專利商標、公司年報等。
檢索方式、功能點、底層數據架構:這三個維度和informa資料庫基本一致,只是樣式展示風格不一樣。
優點:在展示結果關聯性、專業報告、數據維度方面都做得非常好。
缺點: 缺少系統化葯品銷售數據,對中國企業管線監控出現不少滯後和少量錯誤,缺少中國葯監局等數據分析。
cortellis醫葯資料庫目前在世界醫葯領域知名醫葯資料庫之一,因在國內因為其水土不服相比之下使用人群比例不是那麼多。
英富曼Informa
綜合推薦指數:★★★☆
產品組成:Biomedtracker、Pharmaprojects、Sitetrove、Trialtrave、Datamonitor Healthcare、In Vivo、Medtech Insight、Pink Sheet、Scrip多個版塊組成。
數據來源:各國葯品監管機構、醫療衛生機構、新聞雜志、網路資訊、文獻期刊、學術報告、專利商標、公司年報、搜索引擎、學術會議等。
檢索方式、功能點、底層數據架構:這三個維度和cortellis資料庫基本一致,只是樣式展示風格不一樣,更符合國人使用習慣。
優點:可以綜合計算葯物批准通過率,數據更新歷史記錄,在新聞數據追溯、展示結果關聯性、數據維度方面都做得很好。
缺點:沒有銷售數據、沒有仿製葯信息、缺少中國葯監局數據解讀,中國企業管線跟蹤滯後;
Informa醫葯資料庫當前世界主流醫葯資料庫之一,其Pharmaprojects版塊Pharnexcloud的』全球葯物研發版塊』被客戶比較得多,因為價格和缺少國內審批等數據因此佔有率偏低,目前在國內主要客戶人群為高校為主。
一共寫了目前國內主要使用9個主流資料庫的測評,2個國外醫葯資料庫。每個資料庫都各有特色,可以根據自身情況供您選擇。
⑶ 大數據正在如何改變資料庫格局
大數據正在如何改變資料庫格局
提及「資料庫」,大多數人會想到擁有30多年風光歷史的RDBMS。然而,這可能很快就會發生改變。
一大批新的競爭者都在爭奪這一塊重要市場,他們的方法是多種多樣的,卻都有一個共同點:極其專注於大數據。推動新的數據迭代衍生品大部分都是基於底層大數據的3V特徵:數量,速度和種類。本質上來講,今天的數據比以往任何時候都要傳輸更快,體積更大, 同時更加多樣化。這是一個新的數據世界,換言之,傳統的關系資料庫管理系統並沒有真正為此而設計。「基本上,他們不能擴展到大量,或快速,或不同種類的數據。」一位數據分析、數據科學咨詢機構的總裁格雷戈里認為。這就是哈特漢克斯最近發現。截至到2013年左右,營銷服務機構使用不同的資料庫,包括Microsoft sql Server和Oracle真正應用集群(RAC)的組合。「我們注意到,數據隨著時間的增長,我們的系統不能足夠快速的處理信息」一位科技發展公司的負責人肖恩說到。「如果你不斷地購買伺服器,你只能繼續走到這幺遠,我們希望確保自己有向外擴展的平台。」最小化中斷是一個重要的目標,Iannuzzi說到,因此「我們不能只是切換到Hadoop。」相反,卻選擇了拼接機器,基本上把完整的SQL資料庫放到目前流行的Hadoop大數據平台之上,並允許現有的應用程序能夠與它連接,他認為。哈特漢克斯現在是在執行的初期階段,但它已經看到了好處,Iannuzzi說,包括提高容錯性,高可用性,冗餘性,穩定性和「性能全面提升」。一種完美風暴推動了新的資料庫技術的出現,IDC公司研究副總裁Carl Olofson說到。首先,「我們正在使用的設備與過去對比,處理大數據集更加快速,靈活性更強」Olofson說。在過去,這樣的集合「幾乎必須放在旋轉磁碟上」,而且數據必須以特定的方式來結構化,他解釋說。現在有64位定址,使得能夠設置更大的存儲空間以及更快的網路,並能夠串聯多台計算器充當單個大型資料庫。「這些東西在不可用之前開辟了可能性」Olofson說。與此同時,工作負載也發生了變化。10年前的網站主要是靜態的,例如,今天我們享受到的網路服務環境和互動式購物體驗。反過來,需要新的可擴展性,他說。公司正在利用新的方式來使用數據。雖然傳統上我們大部分的精力都放在了對事務處理 – 銷售總額的記錄,比如,數據存儲在可以用來分析的地方 – 現在我們做的更多。應用狀態管理就是一個例子假設你正在玩一個網路游戲。該技術會記錄你與系統的每個會話並連接在一起,以呈現出連續的體驗,即使你切換設備或各種移動,不同的伺服器都會進行處理,Olofson解釋說。數據必須保持連續性,這樣企業才可以分析問題,例如「為什麼從來沒有人穿過水晶廳」。在網路購物方面,為什麼對方點擊選擇顏色後大多數人不會購買某個特殊品牌的鞋子。「以前,我們並沒試圖解決這些問題,或者我們試圖扔進盒子也不太合適」Olofson說。Hadoop是當今新的競爭者中一個重量級的產品。雖然他本身不是一個資料庫,它的成長為企業解決大數據扮演關鍵角色。從本質上講,Hadoop是一個運行高度並行應用程序的數據中心平台,它有很強的可擴展性。通過允許企業擴展「走出去」的分布方式,而不是通過額外昂貴的伺服器「向上」擴展,「它使得我們可以低成本地把一個大的數據集匯總,然後進行分析研究成果」Olofson說。其他新的RDBMS的替代品如NoSQL家族產品,其中包括MongoDB -目前第四大流行資料庫管理系統,比照DB引擎和MarkLogic非結構化數據存儲服務。「關系型資料庫一直是一項偉大的技術持續了30年,但它是建立在不同的時代有不同的技術限制和不同的市場需求,」MarkLogic的執行副總裁喬·產品帕卡說。大數據是不均勻的,他說。許多傳統的技術,這仍然是一個基本要求。「想像一下,你的筆記本電腦上唯一的程序是Excel」帕卡說。「設想一下,你要和你的朋友利用網路保持聯系 – 或者你正在寫一個合約卻不適合放進行和列中。」拼接數據集是特別棘手的「關系型,你把所有這些數據集中在一起前,必須先決定如何去組織所有的列,」他補充說。「我們可以採取任何形式或結構,並立即開始使用它。」NoSQL資料庫沒有使用關系數據模型,並且它們通常不具有SQL介面。盡管許多的NoSQL存儲折中支持速度等其他因素,MarkLogic為企業定身量做,提供更為周全的選擇。NoSQL儲存市場有相當大的增長,據市場研究媒體,不是每個人都認為這是正確的做法-至少,不是在所有情況下。NoSQL系統「解決了許多問題,他們橫向擴展架構,但他們卻拋出了SQL,」一位CEO-Monte Zweben說。這反過來,又為現有的代碼構成問題。Splice Machine是一家基於Hadoop的實時大數據技術公司,支持SQL事務處理,並針對OLAP 和OLAP應用進行實時優化處理。它被稱為替代NewSQL的一個例子,另一類預期會在未來幾年強勁增長。「我們的理念是保持SQL,但橫向擴展架構」Zweben說。「這是新事物,但我們正在努力試圖使它讓人們不必重寫自己的東西。」深度信息科學選擇並堅持使用SQL,但需要另一種方法。公司的DeepSQL資料庫使用相同的應用程序編程介面(API)和關系模型如MySQL,意味著沒有應用變化的需求而使用它。但它以不同的方式處理數據,使用機器學習。DeepSQL可以自動適應使用任何工作負載組合的物理,虛擬或雲主機,該公司表示,從而省去了手動優化資料庫的需要。該公司的首席戰略官Chad Jones表示,在業績大幅增加的同時,也有能力將「規模化」為上千億的行。一種來自Algebraix數據完全不同的方式,表示已經開發了數據的第一個真正的數學化基礎。而計算器硬體需在數學建模前建成,這不是在軟體的情況下,Algebraix首席執行官查爾斯銀說。「軟體,尤其是數據,從未建立在數學的基礎上」他說,「軟體在很大程度上是語言學的問題。」經過五年的研發,Algebraix創造了所謂的「數據的代數」集合論,「數據的通用語言」Silver說。「大數據骯臟的小秘密是數據仍然放在不與其他數據小倉融合的地方」Silver解釋說。「我們已經證明,它都可以用數學方法來表示所有的集成。」配備一個基礎的平台,Algebraix現在為企業提供業務分析作為一種服務。改進的性能,容量和速度都符合預期的承諾。時間會告訴我們哪些新的競爭者取得成功,哪些沒有,但在此期間,長期的領導者如Oracle不會完全停滯不前。「軟體是一個非常時尚行業」安德魯·門德爾松,甲骨文執行副總裁資料庫伺服器技術說。「事情經常去從流行到不受歡迎,回再次到流行。」今天的許多創業公司「帶回炒冷飯少許拋光或旋轉就可以了」他說。「這是一個新一代孩子走出學校和重塑的東西。」SQL是「唯一的語言,可以讓業務分析師提出問題並得到答案,他們沒有程序員,」門德爾松說。「大市場將始終是關系型。」至於新的數據類型,關系型資料庫產品早在上世紀90年代發展為支持非結構化數據,他說。在2013年,甲骨文的同名資料庫版本12C增加了支持JSON(JavaScript對象符號)。與其說需要一個不同類型的資料庫,它更是一種商業模式的轉變,門德爾松說。「雲,若是每個人都去,這將破壞這些小傢伙」他說。「大家都在雲上了,所以在這里有沒有地方來放這些小傢伙?「他們會去亞馬遜的雲與亞馬遜競爭?」 他補充說。「這將是困難的。」甲骨文有「最廣泛的雲服務」門德爾松說。「在現在的位置,我們感覺良好。」Gartner公司的研究主任里克·格林沃爾德,傾向於採取了類似的觀點。「對比傳統強大的RDBMS,新的替代品並非功能齊全」格林沃爾德說。「一些使用案例可以與新的競爭者來解決,但不是全部,並非一種技術」。展望未來,格林沃爾德預計,傳統的RDBMS供貨商感到價格壓力越來越大,並為他們的產品增加新的功能。「有些人會自由地帶來新的競爭者進入管理自己的整個數據生態系統」他說。至於新的產品,有幾個會生存下來,他預測「許多人將被收購或資金耗盡」。今天的新技術並不代表傳統的RDBMS的結束,「正在迅速發展自己」IDC的Olofson。贊成這種說法,「RDBMS是需要明確定義的數據 – 總是會有這樣一個角色。」但也會有一些新的競爭者的角色,他說,特別是物聯網技術和新興技術如非易失性內存晶元模塊(NVDIMM)占據上風。以上是小編為大家分享的關於大數據正在如何改變資料庫格局的相關內容,更多信息可以關注環球青藤分享更多干貨
⑷ 這次被美國「科技霸凌」的中國資料庫《SQL9075 2018 流資料庫》國際技術標准究竟強在哪裡
長期以來,中國一直被三大「卡脖子」技術束縛——「晶元、操作系統、資料庫」。
晶元,自不用說,華為的苦我們都懂的;操作系統,我們剛剛實現了從0到1的過程,路漫漫其修遠;而資料庫作大眾看不見摸不到的技術支撐,很多人不太理解其重要性。在這里,簡單科普一下:資料庫是上述三大核心技術的核心基礎中台、基礎核心軟體,被稱為軟體的靈魂、是關鍵技術皇冠上的明珠,但中國恰恰在該領域的對外技術依賴性最高,這對於大國崛起就很尷尬了,相當於,打開緊箍咒的經我們不會念…
因此,中國在資料庫技術領域已經蓄力已久,五年前我們開始了國際標準的研發工作,經過中國專家組五年來的潛心精研、砥礪攻堅,終於在2019年基本明確了在資料庫技術標准上已取得突破性進展:由中國主導形成標準的《SQL9075 2018 流數據》在2020年只要順利通過審議,便可在全球發布、推廣及適用。同時,《AI-in-Database 庫內人工智慧》提案確認由中國主導形成國際標准,正式進入國際標準的撰寫及確定階段。
⑸ 資料庫的發展前景怎麼樣
進入信息化市場,資料庫的重要性日益凸顯,目前資料庫主要分為資料庫產品、資料庫服務和資料庫支撐體系。我國資料庫產品以關系型為主,非關系型資料庫以鍵值型資料庫為主。
金融、電信、政務、製造和互聯網為我國資料庫應用最為廣泛的領域,但是它們的應用特點各不相同。未來,在企業崛起、國家利好政策和資本關注等因素推動下,我國資料庫行業市場規模有望接近7百億元。
本文核心數據:資料庫產品分布、資料庫市場規模
資料庫主要分為三大類
在信息化時代,資料庫已經逐漸應用於各行各業。資料庫主要分為三大類:資料庫產品、資料庫服務和資料庫支撐體系。
資料庫產品主要由關系型資料庫、非關系型資料庫、混合型資料庫及資料庫周邊工具構成。
資料庫服務是指圍繞資料庫的咨詢規劃、實施部署和運維運營等環節,為資料庫系統的正常、高效、持續、安全使用提供信息技術服務工作。
資料庫支撐體系由從事資料庫學術研究、人才培養、開源社區、評測認證等工作的相關主體共同構成。
⑹ 國內的資料庫產品穩定性怎麼樣,能否替代mysql,oracle等傳統資料庫
國產資料庫產品穩定性應該說已經接近oracle了,目前在政務、金融領域已經大規模開始應用和替換,去IOE,比如南大通用Gbase,互聯網行業的阿里騰訊也都有自己的資料庫,國產資料庫還是不錯的
⑺ 資料庫的發展趨勢和發展前景
數據挖掘、海量存儲、數據倉庫、智能商務運算、高性能並發管理與控制
主流產品的發展現狀
資料庫管理系統經歷了30多年的發展演變,已經取得了輝煌的成就,發展成了一門內容豐富的學科,形成了總量達數百億美元的一個軟體產業。根據Gartner Dataquest公司的調查,2000年國際資料庫市場銷售總額達88億美元,比1999年增長10%。根據CCID的報告,2000年的中國資料庫管理系統市場銷售總額達24.8億元,比1999年增長了41.7%,占軟體市場總銷售額的10.8%。可見,資料庫已經發展成為一個規模巨大、增長迅速的市場。
目前,市場上具有代表性的資料庫產品包括Oracle公司的Oracle、IBM公司的DB2以及微軟的SQL Server等。在一定意義上,這些產品的特徵反映了當前資料庫產業界的最高水平和發展趨勢。因此,分析這些主流產品的發展現狀,是我們了解資料庫技術發展的一個重要方面。
關系資料庫技術仍然是主流
關系資料庫技術出現在20世紀70年代、經過80年代的發展到90年代已經比較成熟,在90年代初期曾一度受到面向對象資料庫的巨大挑戰,但是市場最後還是選擇了關系資料庫。無論是Oracle公司的Oracle 9i、IBM公司的DB2、還是微軟的SQL Server等都是關系型資料庫。Gartner Dataquest的報告顯示關系資料庫管理系統(RDBMS)的市場份額最大, 2000年RDBMS的市場份額占整個資料庫市場的80%,這個比例比1999年增長了15%。這組數據充分說明RDBMS仍然是當今最為流行的資料庫軟體。當前,由於互聯網應用的興起,XML格式的數據的大量出現,學術界有一部分學者認為下一代資料庫將是支持XML模型的新型的資料庫。作者對此持否定態度,認為關系技術仍然是主流,無論是多媒體內容管理、XML數據支持、還是復雜對象支持等都將是在關系系統內核技術基礎上的擴展。
產品形成系列化
一方面,Web和數據倉庫等應用的興起,數據的絕對量在以驚人的速度迅速膨脹;另一方面,移動和嵌入式應用快速增長。針對市場的不同需求,資料庫正在朝系列化方向發展。例如IBM公司的DB2通用資料庫產品包括了從高端的企業級並行資料庫伺服器,到移動端產品DB2 Everywhere的一整套系列。從支持平台看,今天的DB2已經不再是大型機上的專有產品,它支持目前主流的各種平台,包括Linux和Windows NT。此外,它還有各種中間件產品,如DB2 Connect、DB2 Datajointer、DB2 Replication等,構成了一個龐大的資料庫家族。
支持各種互聯網應用
資料庫管理系統是網路經濟的重要基礎設施之一。支持Internet(甚至於Mobile Internet)資料庫應用已經成為資料庫系統的重要方面。例如,Oracle公司從8版起全面支持互聯網應用,是互聯網資料庫的代表。微軟公司更是將SQL Server作為其整個.NET計劃中的一個重要的成分。對於互聯網應用,由於用戶數量是無法事先預測的,這就要求資料庫相比以前擁有能處理更大量的數據以及為更多的用戶提供服務的能力,也就是要擁有良好的可伸縮性及高可用性。此外,互聯網提供大量以XML格式數據為特徵的半結構化數據,支持這種類型的數據的存儲、共享、管理、檢索等也是各資料庫廠商的發展方向。
向智能化集成化方向擴展
資料庫技術的廣泛使用為企業和組織收集並積累了大量的數據。數據豐富知識貧乏的現實直接導致了聯機分析處理(OLAP)、數據倉庫(Data Warehousing)和數據挖掘(Data Mining)等技術的出現,促使資料庫向智能化方向發展。同時企業應用越來越復雜,會涉及到應用伺服器、Web伺服器、其它資料庫、舊系統中的應用以及第三方軟體等,資料庫產品與這些軟體是否具有良好集成性往往關繫到整個系統的性能。Oracle公司的Oracle 9i 產品包括了OLAP、數據挖掘、ETL工具等一套完整的BI(商業智能)支持平台,中間件產品與其核心資料庫具有緊密集成的特性,Oracle Application Server 增加的一項關鍵功能是高速緩存特性,該特性可以將數據從資料庫卸載到應用伺服器,加速 Web用戶對數據的訪問速度。IBM 公司也把BI套件作為其資料庫的一個重點來發展。微軟認為商務智能將是其下一代主要的利潤點。
資料庫技術的發展趨勢
數據、計算機硬體和資料庫應用,這三者推動著資料庫技術與系統的發展。資料庫要管理的數據的復雜度和數據量都在迅速增長;計算機硬體平台的發展仍然實踐著摩爾定律;資料庫應用迅速向深度、廣度擴展。尤其是互聯網的出現,極大地改變了資料庫的應用環境,向資料庫領域提出了前所未有的技術挑戰。這些因素的變化推動著資料庫技術的進步,出現了一批新的資料庫技術,如Web資料庫技術、並行資料庫技術、數據倉庫與聯機分析技術、數據挖掘與商務智能技術、內容管理技術、海量數據管理技術等。限於篇幅,本文不可能逐一去展開來闡述這些方面的變化,只是從這些變化中歸納出資料庫技術發展呈現出的突出特點。
「四高」 即DBMS具有高可靠性、高性能、高可伸縮性和高安全性。資料庫是企業信息系統的核心和基礎,其可靠性和性能是企業領導人非常關心的問題。因為,一旦宕機會給企業造成巨大的經濟損失,甚至會引起法律的糾紛。最典型的例子就是證券交易系統,如果在一個行情來臨的時候,由於交易量的猛增,造成資料庫系統的處理能力不足,導致資料庫系統崩潰,將會給證券公司和股民造成巨大的損失。在我國計算機應用的早期,由於計算機系統還不是企業運營必要的成分,人們對資料庫的重要性認識不足,而且為了經費上的節約常常採用一些低層次的數據管理軟體,如dBASE等,或者盜版的軟體。但是,隨著信息化進程的深化,計算機系統越來越成為企業運營的不可缺少的部分,這時,資料庫系統的穩定和高效是必要的條件。在互聯網環境下還要考慮支持幾千或上萬個用戶同時存取和7x24小時不間斷運行的要求,提供聯機數據備份、容錯、容災以及信息安全措施等。
事實上,資料庫系統的穩定和高效也是技術上長久不衰的追求。此外,從企業信息系統發展的角度上看,一個系統的可擴展能力也是非常重要的。由於業務的擴大,原來的系統規模和能力已經不再適應新的要求的時候,不是重新更換更高檔次的機器,而是在原有的基礎上增加新的設備,如處理器、存儲器等,從而達到分散負載的目的。數據的安全性是另一個重要的課題,普通的基於授權的機制已經不能滿足許多應用的要求,新的基於角色的授權機制以及一些安全功能要素,如存儲隱通道分析、標記、加密、推理控制等,在一些應用中成為切切實實的需要。
「互聯」 指資料庫系統要支持互聯網環境下的應用, 要支持信息系統間「互聯互訪」,要實現不同資料庫間的數據交換和共享,要處理以XML類型的數據為代表的網上數據,甚至要考慮無線通訊發展帶來的革命性的變化。與傳統的資料庫相比,互聯網環境下的資料庫系統要具備處理更大量的數據以及為更多的用戶提供服務的能力,要提供對長事務的有效支持,要提供對XML類型數據的快速存取的有效支持。
「協同」 面向行業應用領域要求,在DBMS核心基礎上,開發豐富的資料庫套件及應用構件,通過與製造業信息化、電子政務等領域應用套件捆綁,形成以DBMS為核心的面向行業的應用軟體產品家族。滿足應用需求,協同發展資料庫套件與應用構件,已成為當今資料庫技術與產品發展的新趨勢。規劃中的Oracle 11i的主要擴展方面據稱主要也是各種面向應用套件的支持。