Membase
Membase 是 NoSQL 家族的一个新的重量级的成员。Membase是开源项目,源代码采用了Apache2.0的使用许可。该项目托管在GitHub.Source tarballs上,可以下载beta版本的Linux二进制包。该产品主要是由North Scale的memcached核心团队成员开发完成,其中还包括Zynga和NHN这两个主要贡献者的工程师,这两个组织都是很大的在线游戏和社区网络空间的供应商。
Membase容易安装、操作,可以从单节点方便的扩展到集群,而且为memcached(有线协议的兼容性)实现了即插即用功能,在应用方面为开发者和经营者提供了一个比较低的门槛。做为缓存解决方案,Memcached已经在不同类型的领域(特别是大容量的Web应用)有了广泛的使用,其中 Memcached的部分基础代码被直接应用到了Membase服务器的前端。
通过兼容多种编程语言和框架,Membase具备了很好的复用性。在安装和配置方面,Membase提供了有效的图形化界面和编程接口,包括可配置 的告警信息。
Membase的目标是提供对外的线性扩展能力,包括为了增加集群容量,可以针对统一的节点进行复制。 另外,对存储的数据进行再分配仍然是必要的。
这方面的一个有趣的特性是NoSQL解决方案所承诺的可预测的性能,类准确性的延迟和吞吐量。通过如下方式可以获得上面提到的特性:
◆ 自动将在线数据迁移到低延迟的存储介质的技术(内存,固态硬盘,磁盘)
◆ 可选的写操作一一异步,同步(基于复制,持久化)
◆ 反向通道再平衡[未来考虑支持]
◆ 多线程低锁争用
◆ 尽可能使用异步处理
◆ 自动实现重复数据删除
◆ 动态再平衡现有集群
◆ 通过把数据复制到多个集群单元和支持快速失败转移来提供系统的高可用性。
MongoDB
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。它的特点是高性能、易部署、易使用,存储数据非常方便。
主要功能特性:
◆ 面向集合存储,易存储对象类型的数据
“面向集合”(Collenction-Oriented),意思是数据被分组存储在数据集中,被称为一个集合(Collenction)。每个 集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。集合的概念类似关系型数据库(RDBMS)里的表(table),不同的是它不需要定 义任何模式(schema)。
◆ 模式自由
模式自由(schema-free),意味着对于存储在mongodb数据库中的文件,我们不需要知道它的任何结构定义。如果需要的话,你完全可以把不同结构的文件存储在同一个数据库里。
◆支持动态查询
◆支持完全索引,包含内部对象
◆支持查询
◆支持复制和故障恢复
◆使用高效的二进制数据存储,包括大型对象(如视频等)
◆自动处理碎片,以支持云计算层次的扩展性
◆支持RUBY,PYTHON,JAVA,C++,PHP等多种语言
◆文件存储格式为BSON(一种JSON的扩展)
BSON(Binary Serialized document Format)存储形式是指:存储在集合中的文档,被存储为键-值对的形式。键用于唯一标识一个文档,为字符串类型,而值则可以是各种复杂的文件类型。
◆可通过网络访问
MongoDB服务端可运行在Linux、Windows或OS X平台,支持32位和64位应用,默认端口为27017。推荐运行在64位平台,因为MongoDB在32位模式运行时支持的最大文件尺寸为2GB。
MongoDB把数据存储在文件中(默认路径为:/data/db),为提高效率使用内存映射文件进行管理。
Hypertable
Hypertable是一个开源、高性能、可伸缩的数据库,它采用与Google的Bigtable相似的模型。在过去数年中,Google为在PC集群 上运行的可伸缩计算基础设施设计建造了三个关键部分。第一个关键的基础设施是Google File System(GFS),这是一个高可用的文件系统,提供了一个全局的命名空间。它通过跨机器(和跨机架)的文件数据复制来达到高可用性,并因此免受传统 文件存储系统无法避免的许多失败的影响,比如电源、内存和网络端口等失败。第二个基础设施是名为Map-Rece的计算框架,它与GFS紧密协作,帮 助处理收集到的海量数据。第三个基础设施是Bigtable,它是传统数据库的替代。Bigtable让你可以通过一些主键来组织海量数据,并实现高效的 查询。Hypertable是Bigtable的一个开源实现,并且根据我们的想法进行了一些改进。
Apache Cassandra
Apache Cassandra是一套开源分布式Key-Value存储系统。它最初由Facebook开发,用于储存特别大的数据。Facebook在使用此系统。
主要特性:
◆ 分布式
◆ 基于column的结构化
◆ 高伸展性
Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写操作,会被复制到其他节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一个Cassandra群集来说,扩展性能 是比较简单的事情,只管在群集里面添加节点就可以了。
Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比 Dynomite(分布式的Key-Value存 储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系数据库之间的开源产品,是非关系数据库当中功能最丰富,最像关系数据库 的。Cassandra最初由Facebook开发,后转变成了开源项目。它是一个网络社交云计算方面理想的数据库。以Amazon专有的完全分布式的Dynamo为基础,结合了Google BigTable基于列族(Column Family)的数据模型。P2P去中心化的存储。很多方面都可以称之为Dynamo 2.0。
CouchDB
所用语言: Erlang
特点:DB一致性,易于使用
使用许可: Apache
协议: HTTP/REST
双向数据复制,持续进行或临时处理,处理时带冲突检查,因此,采用的是master-master复制
MVCC – 写操作不阻塞读操作
可保存文件之前的版本
Crash-only(可靠的)设计
需要不时地进行数据压缩
视图:嵌入式 映射/减少
格式化视图:列表显示
支持进行服务器端文档验证
支持认证
根据变化实时更新
支持附件处理
因此, CouchApps(独立的 js应用程序)
需要 jQuery程序库
最佳应用场景:适用于数据变化较少,执行预定义查询,进行数据统计的应用程序。适用于需要提供数据版本支持的应用程序。
例如:CRM、CMS系统。 master-master复制对于多站点部署是非常有用的。
和其他数据库比较,其突出特点是:
◆ 模式灵活 :使用Cassandra,像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部 署上。
◆ 真正的可扩展性 :Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。
◆ 多数据中心识别 :你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。
◆ 范围查询 :如果你不喜欢全部的键值查询,则可以设置键的范围来查询。
◆ 列表数据结构 :在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。
◆ 分布式写操作 :有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。
问度娘,啥都有。
2. 磁盘存储与数据库存储的区别
磁盘存储一般是以文件管理的形式存在,而数据库存储是文件存储的升级,可以去除数据的冗余,并解决数据的独立性问题。
3. 数据库的两种存储结构
逻辑结构、物理结构
数据库的存储结构也就是数据库存储数据的方式
逻辑存储结构主要用于描述在oracle内部的组织和管理数据的方式;而物理存储结构则用于描述在oracle外部,即操作系统中组织和管理数据的方式
4. 请写出OpenStack存储库设置的相关命令
创建存储卷cindercreate-display-nameVOLNAME&SIZE【SIZE的单位为GB】。
删除存储卷,cinder&delete&VOLNAME-OR-ID,cinder&force-delete&VOLNAME-OR-ID。【强制删除】重命名存储卷,cinder&renameVOLNAME-OR-IDNEW-VOLNAME,显示存储卷信息,cinder&show&VOLNAME-OR-ID。
创建存储卷备份,cinder&backup-create--display-name&BACKUP-VOLNAME&VOLNAME-OR-ID,删除存储卷备份,cinder&backup-delete&VOLNAME-OR-ID,显示存储卷备份信息,cinde&backup-show&VOLNAME-OR-ID,显示存储卷备份列表,cinder&backup-list,创建存储卷快照,cinder&snapshot-create--display-name&SNAPSHOT-VOLNAME&VOLNAME-OR-ID,删除存储卷快照,cinder&snapshot-delete&VOLNAME-OR-ID,重命名存储卷快照,cinder&snapshot-rename&VOLNAME-OR-ID&NEW-VOLNAME。
5. 什么是关系数据库存储模式
关系数据库存储模式是以关系模型为基础的数据库存储方式,它通过关系数据库管理系统(RDBMS)进行数据的管理。关系模型是目前商用数据库领域最流行的一种数据模型,其基本思想是用二维表表示实体及其联系。二维表中的每一列对应实体的一个属性,并给出相应的属性值,每一行形成一个有多种属性组成的多元组,或称元组(TUPPLE),与一个特定实体相对应。
采用关系数据库存储方式,其主要特点是:
(1)关系结构灵活,可满足所有用布尔逻辑运算和数学运算规则形成的查询要求。
(2)关系数据还能搜索、组合和比较不同类型的数据,加入和删除数据都很方便。
(3)其缺点是由于许多操作都要求在文件中顺序查找满足条件特定关系的数据,如果数据库较大,这一查找过程要花费很多时间。
在早期的土地信息系统的建设中,一般采用关系型数据库来存储管理属性数据,而空间数据的管理多采用文件的方式来组织管理。主要原因一是因为关系型数据库对地理空间数据的表达能力不足;二是因为地理信息系统软件中一些数据模型和数据文件的结合很紧密。
随着数据库技术的发展和地理信息系统技术的广泛应用,基于关系对象数据库的空间数据管理技术日渐成熟,出现了商用的统一存储空间数据和属性数据的软件系统,如Oracle数据库系统产品Oracle Spatial支持对空间数据的存储与管理,使用Esri的Arc SDE可用关系型数据库(RDBMS)管理空间数据。
6. websphere mq 完全存储库 部分存储库 区别
集群存储库包含有关集群的信息;例如,有关隶属于集群的队列管理器和集群通道的信息。存储库由集群中的队列管理器主管。通常,为了确保可用性,两个队列管理器(在不同的计算机上)主管完整存储库,完整存储库包含有关集群及其资源的一组完整信息。这两个队列管理器交换消息以使其存储库保持同步。集群中的所有其他队列管理器主管部分存储库,部分存储库包含有关集群及其资源的一组不完整信息。
队列管理器的部分存储库仅包含有关此队列管理器需要与之交换消息的那些队列管理器的信息。队列管理器从完整存储库请求更新,以便在信息更改的情况下,完整存储库队列管理器可将新的信息发送给它们。多数情况下,队列管理器的部分存储库拥有它在集群内执行操作所需的所有信息。当队列管理器需要某些其他信息时,它可查询完整存储库并更新其部分存储库。
为此目的,每个队列管理器使用两种特殊的通道,一种是集群发送方(CLUSSDR)通道,另一种是集群接收方(CLUSRCVR)通道。
7. odi中主存储库和工作存储库的区别
好图像处理建议你先学好数学,只有知道每个公式中的量在图像中代表着什么物理意义你才可能编出来。OPENCV是一个不错的图像处理库,它的代码是开源的,建议你好好看看是怎么写的,以后自己写函数的时候也这样写。因为图像处理涉及到时间的问题,如果你是实时处理的话,那么处理的时间过长就会引起丢帧。
我比较喜欢的几本书,陆宗
8. 粮食承贷库、实际存储库分别什么意思
首先为实际存储库,就是有实际的量,是存储的仓库
承贷库,应该就是账面上的粮食,但是还没有到达,就是我们实际存储仓库里面的那部分。
并没有专业的名词解释,这是我自己理解的
9. 在数据库中存储的是什么
数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。
数据库是一个按数据结构来存储和管理数据的计算机软件系统。数据库的概念实际包括两层意思:数据库是一个实体,它是能够合理保管数据的“仓库”,用户在该“仓库”中存放要管理的事务数据,“数据”和“库”两个概念结合成为数据库。
数据库系统,是由数据库及其管理软件组成的系统。数据库系统是为适应数据处理的需要而发展起来的一种较为理想的数据处理系统,也是一个为实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质 、处理对象和管理系统的集合体。
10. 什么是数据库存储过程
存储过程(Stored Procere)是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,它存储在数据库中,一次编译后永久有效,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。存储过程是数据库中的一个重要对象。在数据量特别庞大的情况下利用存储过程能达到倍速的效率提升。
这类语言主要提供以下功能,让用户可以设计出符合应用需求的程序:
1、变量说明
2、ANSI(美国国家标准化组织)兼容的SQL命令(如Select,Update….)
3、一般流程控制命令(if…else…、while….)
4、内部函数
(10)夕阳存储库扩展阅读:
种类
1、系统存储过程
2、本地存储过程
3、临时存储过程
4、远程存储过程
5、扩展存储过程