当前位置:首页 » 数据仓库 » 数据仓库用什么数据库
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

数据仓库用什么数据库

发布时间: 2022-08-11 05:19:38

① 请问数据仓库都用什么建立

数据仓库是为了管理数据,主要是思想。
具体实施的工具就是为了解决问题而选取了
比如异构/不同源数据的数据抽取问题,要用到etl,可能会用工具 或者自己写程序,看情况而定‘
数据仓库的模型建设,要用到erwin等建模工具;
数据的存放一般是借助关系数据库来实现,那么会用到oracle之类。不过现在已经开始慢慢摒弃传统关系数据库了,借助一些No sql平台,比如hadoop上的hive之类。
不过无论用什么工具,一定要记住,数据仓库的思想是不变的,就是管理数据、把数据的价值通过有效地管理而展现出来,不经管理的数据就是一堆没有提炼的金矿,看着很值钱,直接狗屁用没有。

② 什么是数据仓库

数据仓库(DataWareHouse),简称为DW,是为给企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。被认为是商业智能的核心组件,由比尔·恩门于1990年提出。它是信息的中央存储库,出于分析性报告和决策支持目的而创建。

③ 数据库有哪些

目前比较常见的数据库:

  • SQL是用于访问和处理数据库的标准的计算机语言。

  • MySQL是小型的开源的关系型数据库管理系统。

  • SQL Server 是 Microsoft 开发的关系数据库管理系统。

  • Oracle数据库系统是目前世界上流行的关系数据库管理系统。

  • DB2是关系型数据库平台,其采用多进程多线索的结构,支持多用户或应用程序在同一条SQL 语句中查询不同数据库和数据。

  • PostgreSQL 是一个对象-关系数据库服务器,号称 "世界上最先进的开源关系型数据库"。

  • Hadoop是个很流行的分布式计算解决方案,Hive是基于hadoop的数据仓库工具,hive 构建在基于静态批处理的Hadoop 之上。

  • GreenPlum采用了MPP(大规模并行处理),是一个由多个独立的数据库服务组合成关系型数据库集群。

  • ECharts 是一个使用 JavaScript 实现的开源可视化库,涵盖各行业图表。

  • R是一种集统计分析与图形显示为一体的统计分析软件,具有很强的互动性。

  • python是一种跨平台的计算机程序设计语言,被广泛用于系统管理任务的处理和Web编程。

目前,这些数据库都在树懒学堂有相关教程,可以跟着一步一步学习

④ 数据中心 一般用什么数据库

1、现在一般生产制造业用oracle的比较多;
2、商业企业用sybase较多,也有用oracle的;
3、财务管理用sql server的多(用友等),不过现在也都有for oracle版本的了;
4、中小企业网站方面用mysql、sql server的较多,大型的网上商城用orcale的较多。

oracle、sybase都是大型的数据库,一般用这类数据库的服务器操作系统都是linux的;sql server从操作系统的安全性来说企业级运营都会选择oracle、sybase。另外虽然mysql也是运行在linux上的,但其由于是免费版本,所以企业级也很少用

⑤ 数据仓库是什么

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

我简单的做一个比喻,数据仓库就是可以理解就是一个使用仓库,数据就是这个仓库的货物,而数据仓库的开发人员就是这个仓库的管理员,所以数据仓库就是一个怎么管理好数据,使得数据规范的放在仓库中,便于BI、AI等其他的使用数据的方面可以更好的使用仓库里面的数据,使得数据发挥出更好的价值,显而易见在一堆有规律,整齐的货物里面找一个东西,要比在没有整理的里面找更加有效率。

可以参考这篇文章:数据仓库(1)什么是数据仓库 - 知乎 (hu.com)

⑥ 详解数据仓库和数据库的区别

数据仓库:为企业所有级别的决策制定过程,提供所有类型数据支持的战略(数据)集合。
大数据:所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
传统数据库:一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。

其实从三个定义,我们好像区别不大。

数据库指的是数据的集合,数据仓库也是一个数据集合,大数据也是一个处理和存储数据的地方。

但是不同的是,在于应用场景,和构建的技术原理不一样。

传统数据库是存储根据范式建模的关系型数据,主要用于OLTP(on-line transaction processing)翻译为联机事务处理的软件。大数据是根据map rerce范式构建的出局处理,存储的软件,主要用于OLAP是做分析处理。大数据和传统数据库,还有一个更大的区别在于,处理的数据量以及计算量的大小,当传统数据库,无法在人可以接受的短时间内计算出结果,那这个数据就叫大数据,需要使用到大数据技术处理。而数据仓库本质上是一种数据的处理方式,而不是一种基础软件,它可以依赖于传统数据库,也可以依赖大数据技术去构建。

可以参考这篇文章:数据仓库(2)数据仓库、大数据与传统数据库的区别 - 知乎 (hu.com)

⑦ 数据仓库有哪些

数据仓库,英文名称为 Data Warehouse,可简写为 DW 或 DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。

数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于 1990 年提出,主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,做有系统的分析整理,以利各种分析方法如联机分析处理(OLAP)、数据挖掘(Data Mining)之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS)之创建,帮助决策者能快速有效的自大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构商业智能(BI)。
数据仓库之父比尔·恩门(Bill Inmon)在 1991 年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
1、数据仓库是面向主题的;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题与进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作性信息系统相关。

2、数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库;
数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
3、数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询;
4、数据仓库是随时间而变化的,传统的关系数据库系统比较适合处理格式化的数据,能够较好地满足商业商务处理的需求。稳定的数据以只读格式保存,且不随时间改变。
5、汇总的。操作性数据映射成决策可用的格式。
6、大容量。时间序列数据集合通常都非常大。
7、非规范化的。Dw 数据可以是而且经常是冗余的。
8、元数据。将描述数据的数据保存起来。
9、数据源。数据来自内部的和外部的非集成操作系统。

⑧ 阿里巴巴数据仓库使用什么数据库

11月25日 13:42 阿里巴巴以及淘宝、易趣等大型电子商务网站

都是ORACAL的数据库,JSP的后台语言(或者J2EE等JAVA类),UNIX的服务器

⑨ mes系统用什么数据库

mes系统用Oracle数据库。
MES系统的Oracle数据库一共有2个,一个是lims系统需要的,存储着lims系统的配置数据和每天的业务数据;数据量最庞大最核心的一个就是我们所说的TOTALPLANT数据库,其存储着系统的核心的模型数据和每天产生的业务数据。如Oracle数据库出现问题,系统就将瘫痪,所以在Oracle数据库出现故障的时候,能够快速进行数据恢复就是非常重要的。HoneyWell公司提供了一个数据库备份方案,对数据的恢复没有介绍,其备份方案能对数据库进行联机备份,将数据文件和控制文件备份到以当前备份日期为名字的新建文件夹中,将所有的归档日志备份到一个固定的文件夹中。归档日志特别多,而我们的硬盘容量是有限的,如果一天备份一次数据的话,基本上十多天就将整个硬盘空间耗尽,这就需要每天去查看硬盘空间,删除过时的数据文件备份和归档日志备份,一旦忘记删除过时备份的话,使得以后的备份都不能进行,数据库系统也会因为磁盘空间的不足造成宕机,使得数据库无法正常启动,这在我们MES系统实施初期就发生过这种现象,给系统的实施造成了不小的麻烦,对于归档日志的删除还要特别小心,得判断好日志是否有用,如果将有用的备份误删得话,备份也就无效了,所以制定一个完善可行的备份恢复方案是非常必要的。

⑩ 大量数据用什么数据库

http://www.yesky.com/323/93823.shtml
http://hi..com/supersi_pumc/blog/item/6232a17ba79a26f10bd18724.html
比较SQL Server与Oracle、DB2
出处:不祥
关键词:Sql Server, Oracle, 其他

1.选择一个好的数据库是非常重要的。

2.如何选择一个好的数据库

开放性:
SQL Server
只能在windows 上运行,没有丝毫的开放性,操作系统的系统的稳定对数据库是十分重要的。Windows9X系列产品是偏重于桌面应用,NT server只适合中小型企业。而且windows平台的可靠性,安全性和伸缩性是非常有限的。它不象unix那样久经考验,尤其是在处理大数据量的关键业务时.

Oracle
能在所有主流平台上运行(包括 windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。

DB2
能在所有主流平台上运行(包括windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%.

可伸缩性,并行性
SQL server
DB2
并行实施和共存模型并不成熟。很难处理日益增多的用户数和数据卷。伸缩性有限。

Oracle
平行服务器通过使一组结点共享同一簇中的工作来扩展windownt的能力,提供高可用性和高伸缩性的簇的解决方案。
如果windowsNT不能满足需要, 用户可以把数据库移到UNIX中。

DB2
DB2具有很好的并行性。DB2把数据库管理扩充到了并行的、多节点的环境.
数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日
志。数据库分区有时被称为节点或数据库节点

安全性
SQL server
没有获得任何安全证书。

Oracle Server
获得最高认证级别的ISO标准认证。

DB2
获得最高认证级别的ISO标准认证。

性能
SQL Server
多用户时性能不佳

Oracle
性能最高, 保持windowsNT下的TPC-D和TPC-C的世界记录。

DB2
适用于数据仓库和在线事物处理性能较高。

客户端支持及应用模式
SQL Server
C/S结构,只支持windows客户,可以用ADO,DAO,OLEDB,ODBC连接.

Oracle
多层次网络计算,支持多种工业标准,可以用ODBC,JDBC,OCI等网络客户连接

DB2
跨平台,多层结构,支持ODBC,JDBC等客户

操作简便
SQL Server
操作简单,但只有图形界面.

Oracle
较复杂, 同时提供GUI和命令行,在windowsNT和unix下操作相同

DB2
操作简单,同时提供GUI和命令行,在windowsNT和unix下操作相同

使用风险
SQL server
完全重写的代码,经历了长期的测试,不断延迟,许多功能需要时间来证明。并不十分兼容早期产品。使用需要冒一定风险。

Oracle
长时间的开发经验,完全向下兼容。得到广泛的应用。完全没有风险。

DB2
在巨型企业得到广泛的应用,向下兼容性好。风险小。