⑴ csmar数据库中的行业如何划分为十三个行业
“CSMAR财经数据库”是由深圳市国泰安信息技术有限公司开发。CSMAR系列研究数据库是国泰安公司根据国际数据库标准(CRSP和COMPUSTAT)开发的专门针对中国金融、经济领域的研究型精准数据库,包括股票市场、公司研究、基金市场、债券市场、衍生市场、经济研究、行业研究、海外研究和专题研究等11大系列,75个数据库。
是全面涵盖中国经济、金融主要领域的高精准研究型数据库,能满足不同研究者的需求,帮助研究者最快和最方便的构建研究模型。
⑵ 2022年国内主流医药数据库有哪些
目前主要使用的医药数据库分为两大类,一个是免费医药数据库,一个是商业综合类的医药数据库。医药数据库的本质是让用户能在短时间内在一个网站把想要的信息通过检索一览无余,因此,全面性、准确性、及时性是该类数据库的主要指标。
先说免费医药数据库,大大小小的比较多,但真正用户量大,达到一定使用频率的,我们在此推荐三个最全面的:
①:DrugBank数据库,它是加拿大阿尔伯塔大学(University of Alberta)研究人员将详细的药物数据和全面的药物目标信息结合起来,建立的真实可靠的生物信息学和化学信息学数据库。DrugBank包含50万种药物信息,其中包括2653种经批准的小分子药物、1417种经批准的生物技术(蛋白质/肽)药物、131种营养品和6451种实验药物。
②:pharnexcloud,他目前是开放程度高的中文界面医药数据库,包含了全球药品研发管线、审评审批进度、全球临床试验、中国临床试验、药品招投标、集采、一致性评价等大量整合信息。
③:ClinicalTrials,它是一个基于网络的资源,为患者、他们的家庭成员、医疗保健专业人员、研究人员和公众提供了方便地访问关于各种疾病和病症的公共和私人支持的临床研究的信息。该网站由 美国国立卫生研究院的国家医学图书馆(NLM) 维护(NIH),美国国家医学图书馆提供的资源,探索所有 50 个州和 221 个国家/地区的 422,494 项研究。注:所有资料及相关研究仅供参考,未取得相关政府机构评定。
免费数据库涉及数据层面的关联性相对单一、数据深度存在一定局限性,毕竟这类数据库没有像商业数据库那样花上足够多的人力成本及时间成本去清洗、整理、维护数据。
商业类医药数据库往往是高价值数据库的代表。商业类医药数据库特点是功能强大不仅能对学术类信息加以融合处理,还能分析药品全生命周期数据,竞品药品销售详细情况、竞品企业招投标、投融资、集中采购信息等;除此之外还能实时跟踪产品管线最新信息,做到实时调整战略方向,防止做无用功浪费企业资源。现在商业类数据库可以说是医药企业必备的数据库。笔者就国内药企主要使用的商业医药数据库(同时对比两个国外数据库)给大家一一列举。
药融云企业版Pharnexcloud
数据全面性:★★★★★
运营企业:药融云数字科技
上线时间:2020年
数据库数量:218个
产品组成:药物研发库群、上市药品库群、药品销售库群、市场信息库群、一致性评价库群、原料药库群、医疗器械库群、生产检验库群、合理用药库群、医药文献等十个版块构成。
数据来源:各国药品监管机构、试验研究、学术会议报告、文献期刊、异构资源、企业公告各国卫生机构、医学新闻杂志、网络资讯、专利、协会学会等。
数据特色:数据采集近80个主流国家,监控全球10万+医药数据信息源,数据放大模型算法涉及人口学、经济学、发病率、医疗资源分布等各类特征参数。
增值服务:①专人对接需求,团队解决问题。②沙龙、巡讲、峰会、项目交易、需求对接等活动支持,能加入他们药融圈生态链。
优点:全面覆盖医药领域全产业链各环节,数据总量大、数据来源、专业报告、数据算法、结果展示都做得非常好。
缺点:相比较于全球顶尖的cortellis、informa等,pharnexcloud的数据展示结果关联性还有明显的进步空间。
pharnexcloud医药数据库后来居上,进步很快,近年来逐步成为国内医药企业选择较多的医药数据库,因其产品功能的全面和数据全面性得到越来越多的认可,希望能保持这个进步速度。
药智
综合性推荐指数:★★★★☆
运营企业:重庆康洲数据
上线时间:2009年
产品组成:由研发、一致性、生产、上市、市场、用药、药化、中药材、器械等九个版块组成。
数据来源:地区机构、资讯、企业公告报道、医疗会议、公司年度报告、医疗卫生机构、医学杂志、专利、商标、技术实施文件、学术会议、技术报告、科技期刊等。
数据库数量:172个
检索方式、功能点、底层数据架构、界面展示:与insight、Pharnexcloud数据库大体一致。
优点:药物综合报告、审评、临床数据都做得相当不错。而且仅此一家推出了化妆品、食品数据库。
缺点:药品销售数据起步阶段暂不够成熟,全球数据相对量少。(药品销售数据对于药品的立项调研、竞品销售分析、销售战略目标制定都是重中之重)。创新药物收录数量有待提高。
医药魔方
综合推荐指数:★★★★☆
运营企业:北京华彬立成
上线时间:2013年
数据库数量:49个
产品组成:资本透视、全球新药、全球临床、基础数据、市场洞察这五个版块构成。
数据来源:实验室研究、内部会议、专业报道、专利、商标、技术实施文件、学术会议、技术报告、科技期刊、文献、教科书、地区机构、资讯、新闻资讯、公司年度报告等。
产品亮点:资本透视和创新药物版块做得非常不错,在该领域都属于行业佼佼者。
收费:单价在国内偏高
优点:投融资版块、可视化疾病图谱和靶点整合、审评、临床等数据做充分关联、新上线的NextMed板块有一定领先性、其投融资版块做得很好。
缺点:总体数据数量偏少,药物研发也只解读了3万多个药物,比较同类产品丢失部分功能版块,全球数据不够丰富。销售数据模块虽然有,但十分封闭,无任何宣传,对其具体情况业内不了解。
医药魔方作为创新药物和医药投融资数据库目前国内用户沉积多的数据库之一,但其产品功能过于封闭,已成自己的围墙。
药渡
综合推荐指数:★★★☆
运营企业:药渡经纬信息科技
上线时间:2013年
数据库数量:132个
产品组成:由全球药物、全球器械、投资生态、临床研究、专利文献、政策法规、世界药问、数据定制八个版块构成。
数据来源:实验室研究、内部会议、专业报道、专利、商标、技术实施文件、学术会议、技术报告、科技期刊、在线数据库、在线辞典、电子书库、地区机构、资讯、企业公告报道、医疗会议等。
优点:其药物研发信息与国内审评、临床等多个库均有不错的关联,层级结构、标签及界面都做得相当不错。对生物药、化学药等细微标签做了单独优化。
缺点:目前没有药品销售数据,临床、上市药品分析等数据采集方面比较弱,总体数据量在业内偏弱。
药渡作为国内老牌医药数据库之一以全球研发数据为核心,重点发展咨询业务。缺少销售数据其核心版块数据,导致其数据业务只是一直低价在为其咨询业务做支撑。
米内
综合推荐指数:★★★★☆
运营企业:广州标点医药信息
上线时间:2010年
数据库数量:72个
产品组成:药品销售(多层格局,医院、零售)、审评进度、上市药品、临床试验、中标数据、全球新药研发、全球专利、项目进度这个七个版块构成
产品特色:国内药品销售数据领头企业,其医院销售数据以“三大终端六大市场”为基础,分层抽样多等级医院放大至全国。城市公立医院、县级公立医院、实体药店、网上药店、城市社区卫生中心、乡镇卫生院等各类维度齐备。
优点:南方所背景,医院销售数据算法和研发数据都做得非常不错。六大格局在国内首屈一指。近期上线了独家的电商类数据,虽然业界还在争议电商数据可信度,但毕竟先走出了这一步。
缺点:全面性比较弱,销售数据以外的全球数据、研发数据、审批数据相对重视程度很低,版本一直没有大的进展。
米内医药数据库南方所背景其医院销售版块覆盖面最广之一,但其它版块相对薄弱。
丁香园Insight
综合推荐指数:★★★☆
运营企业:杭州观澜网络
上线时间:2013年Insight(2006年总部)
产品组成:临床试验、申报进度、药品库、上市产品、制药企业、招投标、一致性评价、医药新闻、生物制品、全球数据等十个版块构成。
数据来源:内部会议、专业报道、专利、商标、在线数据库、在线词典、电子书库、异构资源共享平台、知识库、地区机构、资讯、企业公告报道、医疗会议、新闻资讯等。
产品特色:其界面小功能开发丰富特别是小图标的应用在国内UI设计上是好的,区别于同类产品。
检索方式、功能点、底层数据架构、界面展示:与药智数据库大体一致。
优点:搜索体验、UI界面小功能、时间轴、注册数据、国内药物审评、上市批文这些国内数据中做得非常不错。
缺点:市场和销售相关数据涉及较少,全球研发数据处于刚起步阶段(全球药物研发数据对于药企来说十分重要可谓是医药行业的风向标,在全球药物格局、药物立项调研、企业发展战略方向制定方面的重要性不言而喻)
Insight作为老牌医药数据库的典型代表,背靠丁香园集团的大树,目前国内用户沉积多的数据库之一,但因其药物研发数据版块、药品市场与销售数据起步晚,影响了其总体优势。
上海医工院PDB
综合推荐指数:★★★
运营企业:上海数图健康医药科技
上线时间:2011年
数据库数量:31个
产品组成:分为药物综合和新药研发监测两个数据库;药物综合数据库包含了国内市场、细分市场、全球市场、国内工业生产、企业经济运行五个版块;新药研发监测数据库包含了全球研发、中国研发、一致性评价、企业竞争,品种筛选分析五个版块。
数据来源:专利、商标、技术实施文件、学术会议、技术报告、科技期刊、文献、教科书、地区机构、资讯、新闻资讯、公司年度报告、pjb等。
优点:工信部背景知名度高国产医药数据库鼻祖,审评、临床等数据有不错的关联展示;新上线的RPDB零售板块有明显的优势提升;RAS医药处方分析系统具备一定独家性。
缺点:数据全面性相对不高,部分工业类数据更新较慢,UI设计过于传统。PDB作为全国老牌医药数据库之一,全球药物研发数据采集处于起步阶段,也许是底层架构设计问题单开了一个CPM(新药研发监测数据库)导致其部分关联性较差。
科睿唯安cortellis
综合推荐指数:★★★★☆
产品组成:Cortellis 数据库包含Cortellis竞争情报、Cortellis早期药物发现、CMC、仿制药、原料药、系统生物学Metacore等等多个模块,主要由竞争信息、疾病简报、监管信息、新闻、药物发现信息这几个版块构成;
数据来源:各大药品监管机构、新闻杂志、网络资讯、文献期刊、学术报告、专利商标、公司年报等。
检索方式、功能点、底层数据架构:这三个维度和informa数据库基本一致,只是样式展示风格不一样。
优点:在展示结果关联性、专业报告、数据维度方面都做得非常好。
缺点: 缺少系统化药品销售数据,对中国企业管线监控出现不少滞后和少量错误,缺少中国药监局等数据分析。
cortellis医药数据库目前在世界医药领域知名医药数据库之一,因在国内因为其水土不服相比之下使用人群比例不是那么多。
英富曼Informa
综合推荐指数:★★★☆
产品组成:Biomedtracker、Pharmaprojects、Sitetrove、Trialtrave、Datamonitor Healthcare、In Vivo、Medtech Insight、Pink Sheet、Scrip多个版块组成。
数据来源:各国药品监管机构、医疗卫生机构、新闻杂志、网络资讯、文献期刊、学术报告、专利商标、公司年报、搜索引擎、学术会议等。
检索方式、功能点、底层数据架构:这三个维度和cortellis数据库基本一致,只是样式展示风格不一样,更符合国人使用习惯。
优点:可以综合计算药物批准通过率,数据更新历史记录,在新闻数据追溯、展示结果关联性、数据维度方面都做得很好。
缺点:没有销售数据、没有仿制药信息、缺少中国药监局数据解读,中国企业管线跟踪滞后;
Informa医药数据库当前世界主流医药数据库之一,其Pharmaprojects版块Pharnexcloud的’全球药物研发版块’被客户比较得多,因为价格和缺少国内审批等数据因此占有率偏低,目前在国内主要客户人群为高校为主。
一共写了目前国内主要使用9个主流数据库的测评,2个国外医药数据库。每个数据库都各有特色,可以根据自身情况供您选择。
⑶ 大数据正在如何改变数据库格局
大数据正在如何改变数据库格局
提及“数据库”,大多数人会想到拥有30多年风光历史的RDBMS。然而,这可能很快就会发生改变。
一大批新的竞争者都在争夺这一块重要市场,他们的方法是多种多样的,却都有一个共同点:极其专注于大数据。推动新的数据迭代衍生品大部分都是基于底层大数据的3V特征:数量,速度和种类。本质上来讲,今天的数据比以往任何时候都要传输更快,体积更大, 同时更加多样化。这是一个新的数据世界,换言之,传统的关系数据库管理系统并没有真正为此而设计。“基本上,他们不能扩展到大量,或快速,或不同种类的数据。”一位数据分析、数据科学咨询机构的总裁格雷戈里认为。这就是哈特汉克斯最近发现。截至到2013年左右,营销服务机构使用不同的数据库,包括Microsoft sql Server和Oracle真正应用集群(RAC)的组合。“我们注意到,数据随着时间的增长,我们的系统不能足够快速的处理信息”一位科技发展公司的负责人肖恩说到。“如果你不断地购买服务器,你只能继续走到这幺远,我们希望确保自己有向外扩展的平台。”最小化中断是一个重要的目标,Iannuzzi说到,因此“我们不能只是切换到Hadoop。”相反,却选择了拼接机器,基本上把完整的SQL数据库放到目前流行的Hadoop大数据平台之上,并允许现有的应用程序能够与它连接,他认为。哈特汉克斯现在是在执行的初期阶段,但它已经看到了好处,Iannuzzi说,包括提高容错性,高可用性,冗余性,稳定性和“性能全面提升”。一种完美风暴推动了新的数据库技术的出现,IDC公司研究副总裁Carl Olofson说到。首先,“我们正在使用的设备与过去对比,处理大数据集更加快速,灵活性更强”Olofson说。在过去,这样的集合“几乎必须放在旋转磁盘上”,而且数据必须以特定的方式来结构化,他解释说。现在有64位寻址,使得能够设置更大的存储空间以及更快的网络,并能够串联多台计算器充当单个大型数据库。“这些东西在不可用之前开辟了可能性”Olofson说。与此同时,工作负载也发生了变化。10年前的网站主要是静态的,例如,今天我们享受到的网络服务环境和互动式购物体验。反过来,需要新的可扩展性,他说。公司正在利用新的方式来使用数据。虽然传统上我们大部分的精力都放在了对事务处理 – 销售总额的记录,比如,数据存储在可以用来分析的地方 – 现在我们做的更多。应用状态管理就是一个例子假设你正在玩一个网络游戏。该技术会记录你与系统的每个会话并连接在一起,以呈现出连续的体验,即使你切换设备或各种移动,不同的服务器都会进行处理,Olofson解释说。数据必须保持连续性,这样企业才可以分析问题,例如“为什么从来没有人穿过水晶厅”。在网络购物方面,为什么对方点击选择颜色后大多数人不会购买某个特殊品牌的鞋子。“以前,我们并没试图解决这些问题,或者我们试图扔进盒子也不太合适”Olofson说。Hadoop是当今新的竞争者中一个重量级的产品。虽然他本身不是一个数据库,它的成长为企业解决大数据扮演关键角色。从本质上讲,Hadoop是一个运行高度并行应用程序的数据中心平台,它有很强的可扩展性。通过允许企业扩展“走出去”的分布方式,而不是通过额外昂贵的服务器“向上”扩展,“它使得我们可以低成本地把一个大的数据集汇总,然后进行分析研究成果”Olofson说。其他新的RDBMS的替代品如NoSQL家族产品,其中包括MongoDB -目前第四大流行数据库管理系统,比照DB引擎和MarkLogic非结构化数据存储服务。“关系型数据库一直是一项伟大的技术持续了30年,但它是建立在不同的时代有不同的技术限制和不同的市场需求,”MarkLogic的执行副总裁乔·产品帕卡说。大数据是不均匀的,他说。许多传统的技术,这仍然是一个基本要求。“想象一下,你的笔记本电脑上唯一的程序是Excel”帕卡说。“设想一下,你要和你的朋友利用网络保持联系 – 或者你正在写一个合约却不适合放进行和列中。”拼接数据集是特别棘手的“关系型,你把所有这些数据集中在一起前,必须先决定如何去组织所有的列,”他补充说。“我们可以采取任何形式或结构,并立即开始使用它。”NoSQL数据库没有使用关系数据模型,并且它们通常不具有SQL接口。尽管许多的NoSQL存储折中支持速度等其他因素,MarkLogic为企业定身量做,提供更为周全的选择。NoSQL储存市场有相当大的增长,据市场研究媒体,不是每个人都认为这是正确的做法-至少,不是在所有情况下。NoSQL系统“解决了许多问题,他们横向扩展架构,但他们却抛出了SQL,”一位CEO-Monte Zweben说。这反过来,又为现有的代码构成问题。Splice Machine是一家基于Hadoop的实时大数据技术公司,支持SQL事务处理,并针对OLAP 和OLAP应用进行实时优化处理。它被称为替代NewSQL的一个例子,另一类预期会在未来几年强劲增长。“我们的理念是保持SQL,但横向扩展架构”Zweben说。“这是新事物,但我们正在努力试图使它让人们不必重写自己的东西。”深度信息科学选择并坚持使用SQL,但需要另一种方法。公司的DeepSQL数据库使用相同的应用程序编程接口(API)和关系模型如MySQL,意味着没有应用变化的需求而使用它。但它以不同的方式处理数据,使用机器学习。DeepSQL可以自动适应使用任何工作负载组合的物理,虚拟或云主机,该公司表示,从而省去了手动优化数据库的需要。该公司的首席战略官Chad Jones表示,在业绩大幅增加的同时,也有能力将“规模化”为上千亿的行。一种来自Algebraix数据完全不同的方式,表示已经开发了数据的第一个真正的数学化基础。而计算器硬件需在数学建模前建成,这不是在软件的情况下,Algebraix首席执行官查尔斯银说。“软件,尤其是数据,从未建立在数学的基础上”他说,“软件在很大程度上是语言学的问题。”经过五年的研发,Algebraix创造了所谓的“数据的代数”集合论,“数据的通用语言”Silver说。“大数据肮脏的小秘密是数据仍然放在不与其他数据小仓融合的地方”Silver解释说。“我们已经证明,它都可以用数学方法来表示所有的集成。”配备一个基础的平台,Algebraix现在为企业提供业务分析作为一种服务。改进的性能,容量和速度都符合预期的承诺。时间会告诉我们哪些新的竞争者取得成功,哪些没有,但在此期间,长期的领导者如Oracle不会完全停滞不前。“软件是一个非常时尚行业”安德鲁·门德尔松,甲骨文执行副总裁数据库服务器技术说。“事情经常去从流行到不受欢迎,回再次到流行。”今天的许多创业公司“带回炒冷饭少许抛光或旋转就可以了”他说。“这是一个新一代孩子走出学校和重塑的东西。”SQL是“唯一的语言,可以让业务分析师提出问题并得到答案,他们没有程序员,”门德尔松说。“大市场将始终是关系型。”至于新的数据类型,关系型数据库产品早在上世纪90年代发展为支持非结构化数据,他说。在2013年,甲骨文的同名数据库版本12C增加了支持JSON(JavaScript对象符号)。与其说需要一个不同类型的数据库,它更是一种商业模式的转变,门德尔松说。“云,若是每个人都去,这将破坏这些小家伙”他说。“大家都在云上了,所以在这里有没有地方来放这些小家伙?“他们会去亚马逊的云与亚马逊竞争?” 他补充说。“这将是困难的。”甲骨文有“最广泛的云服务”门德尔松说。“在现在的位置,我们感觉良好。”Gartner公司的研究主任里克·格林沃尔德,倾向于采取了类似的观点。“对比传统强大的RDBMS,新的替代品并非功能齐全”格林沃尔德说。“一些使用案例可以与新的竞争者来解决,但不是全部,并非一种技术”。展望未来,格林沃尔德预计,传统的RDBMS供货商感到价格压力越来越大,并为他们的产品增加新的功能。“有些人会自由地带来新的竞争者进入管理自己的整个数据生态系统”他说。至于新的产品,有几个会生存下来,他预测“许多人将被收购或资金耗尽”。今天的新技术并不代表传统的RDBMS的结束,“正在迅速发展自己”IDC的Olofson。赞成这种说法,“RDBMS是需要明确定义的数据 – 总是会有这样一个角色。”但也会有一些新的竞争者的角色,他说,特别是物联网技术和新兴技术如非易失性内存芯片模块(NVDIMM)占据上风。以上是小编为大家分享的关于大数据正在如何改变数据库格局的相关内容,更多信息可以关注环球青藤分享更多干货
⑷ 这次被美国“科技霸凌”的中国数据库《SQL9075 2018 流数据库》国际技术标准究竟强在哪里
长期以来,中国一直被三大“卡脖子”技术束缚——“芯片、操作系统、数据库”。
芯片,自不用说,华为的苦我们都懂的;操作系统,我们刚刚实现了从0到1的过程,路漫漫其修远;而数据库作大众看不见摸不到的技术支撑,很多人不太理解其重要性。在这里,简单科普一下:数据库是上述三大核心技术的核心基础中台、基础核心软件,被称为软件的灵魂、是关键技术皇冠上的明珠,但中国恰恰在该领域的对外技术依赖性最高,这对于大国崛起就很尴尬了,相当于,打开紧箍咒的经我们不会念…
因此,中国在数据库技术领域已经蓄力已久,五年前我们开始了国际标准的研发工作,经过中国专家组五年来的潜心精研、砥砺攻坚,终于在2019年基本明确了在数据库技术标准上已取得突破性进展:由中国主导形成标准的《SQL9075 2018 流数据》在2020年只要顺利通过审议,便可在全球发布、推广及适用。同时,《AI-in-Database 库内人工智能》提案确认由中国主导形成国际标准,正式进入国际标准的撰写及确定阶段。
⑸ 数据库的发展前景怎么样
进入信息化市场,数据库的重要性日益凸显,目前数据库主要分为数据库产品、数据库服务和数据库支撑体系。我国数据库产品以关系型为主,非关系型数据库以键值型数据库为主。
金融、电信、政务、制造和互联网为我国数据库应用最为广泛的领域,但是它们的应用特点各不相同。未来,在企业崛起、国家利好政策和资本关注等因素推动下,我国数据库行业市场规模有望接近7百亿元。
本文核心数据:数据库产品分布、数据库市场规模
数据库主要分为三大类
在信息化时代,数据库已经逐渐应用于各行各业。数据库主要分为三大类:数据库产品、数据库服务和数据库支撑体系。
数据库产品主要由关系型数据库、非关系型数据库、混合型数据库及数据库周边工具构成。
数据库服务是指围绕数据库的咨询规划、实施部署和运维运营等环节,为数据库系统的正常、高效、持续、安全使用提供信息技术服务工作。
数据库支撑体系由从事数据库学术研究、人才培养、开源社区、评测认证等工作的相关主体共同构成。
⑹ 国内的数据库产品稳定性怎么样,能否替代mysql,oracle等传统数据库
国产数据库产品稳定性应该说已经接近oracle了,目前在政务、金融领域已经大规模开始应用和替换,去IOE,比如南大通用Gbase,互联网行业的阿里腾讯也都有自己的数据库,国产数据库还是不错的
⑺ 数据库的发展趋势和发展前景
数据挖掘、海量存储、数据仓库、智能商务运算、高性能并发管理与控制
主流产品的发展现状
数据库管理系统经历了30多年的发展演变,已经取得了辉煌的成就,发展成了一门内容丰富的学科,形成了总量达数百亿美元的一个软件产业。根据Gartner Dataquest公司的调查,2000年国际数据库市场销售总额达88亿美元,比1999年增长10%。根据CCID的报告,2000年的中国数据库管理系统市场销售总额达24.8亿元,比1999年增长了41.7%,占软件市场总销售额的10.8%。可见,数据库已经发展成为一个规模巨大、增长迅速的市场。
目前,市场上具有代表性的数据库产品包括Oracle公司的Oracle、IBM公司的DB2以及微软的SQL Server等。在一定意义上,这些产品的特征反映了当前数据库产业界的最高水平和发展趋势。因此,分析这些主流产品的发展现状,是我们了解数据库技术发展的一个重要方面。
关系数据库技术仍然是主流
关系数据库技术出现在20世纪70年代、经过80年代的发展到90年代已经比较成熟,在90年代初期曾一度受到面向对象数据库的巨大挑战,但是市场最后还是选择了关系数据库。无论是Oracle公司的Oracle 9i、IBM公司的DB2、还是微软的SQL Server等都是关系型数据库。Gartner Dataquest的报告显示关系数据库管理系统(RDBMS)的市场份额最大, 2000年RDBMS的市场份额占整个数据库市场的80%,这个比例比1999年增长了15%。这组数据充分说明RDBMS仍然是当今最为流行的数据库软件。当前,由于互联网应用的兴起,XML格式的数据的大量出现,学术界有一部分学者认为下一代数据库将是支持XML模型的新型的数据库。作者对此持否定态度,认为关系技术仍然是主流,无论是多媒体内容管理、XML数据支持、还是复杂对象支持等都将是在关系系统内核技术基础上的扩展。
产品形成系列化
一方面,Web和数据仓库等应用的兴起,数据的绝对量在以惊人的速度迅速膨胀;另一方面,移动和嵌入式应用快速增长。针对市场的不同需求,数据库正在朝系列化方向发展。例如IBM公司的DB2通用数据库产品包括了从高端的企业级并行数据库服务器,到移动端产品DB2 Everywhere的一整套系列。从支持平台看,今天的DB2已经不再是大型机上的专有产品,它支持目前主流的各种平台,包括Linux和Windows NT。此外,它还有各种中间件产品,如DB2 Connect、DB2 Datajointer、DB2 Replication等,构成了一个庞大的数据库家族。
支持各种互联网应用
数据库管理系统是网络经济的重要基础设施之一。支持Internet(甚至于Mobile Internet)数据库应用已经成为数据库系统的重要方面。例如,Oracle公司从8版起全面支持互联网应用,是互联网数据库的代表。微软公司更是将SQL Server作为其整个.NET计划中的一个重要的成分。对于互联网应用,由于用户数量是无法事先预测的,这就要求数据库相比以前拥有能处理更大量的数据以及为更多的用户提供服务的能力,也就是要拥有良好的可伸缩性及高可用性。此外,互联网提供大量以XML格式数据为特征的半结构化数据,支持这种类型的数据的存储、共享、管理、检索等也是各数据库厂商的发展方向。
向智能化集成化方向扩展
数据库技术的广泛使用为企业和组织收集并积累了大量的数据。数据丰富知识贫乏的现实直接导致了联机分析处理(OLAP)、数据仓库(Data Warehousing)和数据挖掘(Data Mining)等技术的出现,促使数据库向智能化方向发展。同时企业应用越来越复杂,会涉及到应用服务器、Web服务器、其它数据库、旧系统中的应用以及第三方软件等,数据库产品与这些软件是否具有良好集成性往往关系到整个系统的性能。Oracle公司的Oracle 9i 产品包括了OLAP、数据挖掘、ETL工具等一套完整的BI(商业智能)支持平台,中间件产品与其核心数据库具有紧密集成的特性,Oracle Application Server 增加的一项关键功能是高速缓存特性,该特性可以将数据从数据库卸载到应用服务器,加速 Web用户对数据的访问速度。IBM 公司也把BI套件作为其数据库的一个重点来发展。微软认为商务智能将是其下一代主要的利润点。
数据库技术的发展趋势
数据、计算机硬件和数据库应用,这三者推动着数据库技术与系统的发展。数据库要管理的数据的复杂度和数据量都在迅速增长;计算机硬件平台的发展仍然实践着摩尔定律;数据库应用迅速向深度、广度扩展。尤其是互联网的出现,极大地改变了数据库的应用环境,向数据库领域提出了前所未有的技术挑战。这些因素的变化推动着数据库技术的进步,出现了一批新的数据库技术,如Web数据库技术、并行数据库技术、数据仓库与联机分析技术、数据挖掘与商务智能技术、内容管理技术、海量数据管理技术等。限于篇幅,本文不可能逐一去展开来阐述这些方面的变化,只是从这些变化中归纳出数据库技术发展呈现出的突出特点。
“四高” 即DBMS具有高可靠性、高性能、高可伸缩性和高安全性。数据库是企业信息系统的核心和基础,其可靠性和性能是企业领导人非常关心的问题。因为,一旦宕机会给企业造成巨大的经济损失,甚至会引起法律的纠纷。最典型的例子就是证券交易系统,如果在一个行情来临的时候,由于交易量的猛增,造成数据库系统的处理能力不足,导致数据库系统崩溃,将会给证券公司和股民造成巨大的损失。在我国计算机应用的早期,由于计算机系统还不是企业运营必要的成分,人们对数据库的重要性认识不足,而且为了经费上的节约常常采用一些低层次的数据管理软件,如dBASE等,或者盗版的软件。但是,随着信息化进程的深化,计算机系统越来越成为企业运营的不可缺少的部分,这时,数据库系统的稳定和高效是必要的条件。在互联网环境下还要考虑支持几千或上万个用户同时存取和7x24小时不间断运行的要求,提供联机数据备份、容错、容灾以及信息安全措施等。
事实上,数据库系统的稳定和高效也是技术上长久不衰的追求。此外,从企业信息系统发展的角度上看,一个系统的可扩展能力也是非常重要的。由于业务的扩大,原来的系统规模和能力已经不再适应新的要求的时候,不是重新更换更高档次的机器,而是在原有的基础上增加新的设备,如处理器、存储器等,从而达到分散负载的目的。数据的安全性是另一个重要的课题,普通的基于授权的机制已经不能满足许多应用的要求,新的基于角色的授权机制以及一些安全功能要素,如存储隐通道分析、标记、加密、推理控制等,在一些应用中成为切切实实的需要。
“互联” 指数据库系统要支持互联网环境下的应用, 要支持信息系统间“互联互访”,要实现不同数据库间的数据交换和共享,要处理以XML类型的数据为代表的网上数据,甚至要考虑无线通讯发展带来的革命性的变化。与传统的数据库相比,互联网环境下的数据库系统要具备处理更大量的数据以及为更多的用户提供服务的能力,要提供对长事务的有效支持,要提供对XML类型数据的快速存取的有效支持。
“协同” 面向行业应用领域要求,在DBMS核心基础上,开发丰富的数据库套件及应用构件,通过与制造业信息化、电子政务等领域应用套件捆绑,形成以DBMS为核心的面向行业的应用软件产品家族。满足应用需求,协同发展数据库套件与应用构件,已成为当今数据库技术与产品发展的新趋势。规划中的Oracle 11i的主要扩展方面据称主要也是各种面向应用套件的支持。