Ⅰ 数据库建设方案及数据质量检查标准
1 .制定调查资源整合方案
通过合理编码方式理顺各类数据间的关系,保证不同类别数据的紧密性,完整体现地学资料数据的多源性和空间性。
2.数据库建设标准
根据资源整合方案,利用关系数据库技术和空间数据库技术,建立CO2地质储存调查数据库,有效储存和管理各种空间数据和属性数据,保证数据间的逻辑合理性,达到充分利用调查数据,并快速输出数据的目的。
3.数据质量检查标准及方法
根据资源整合方案,制定数据质量标准,开发相应质量检查软件,对数据进行质量检查,确保入库数据的有效性和合法性。
Ⅱ 数据库建设
(一)数据准备
1.数据收集
1∶25万遥感地质填图数据包含影像数据和矢量数据两种格式,影像数据主要包括:TM原始影像、SPOT原始影像、SAR原始影像、TM与SPOT融合影像、TM与SAR融合影像、信息增强分类处理后的整幅影像或影像子区;矢量数据主要包括:航磁等值线影像、1∶25万地形图、地质图、航磁解译地质图、遥感解译单元图、遥感解译地质图。现以新疆瓦石峡地区、内蒙古阿龙山地区为例,具体情况如下:
(1)瓦石峡地区
TM卫星影像
SAR卫星影像
航磁等值线(TIF)影像
航磁解译地质图
地质图
遥感解译影像单元图
遥感解译地质图
(2)阿龙山地区
TM卫星影像
SPOT卫星影像
航磁等值线(TIF)影像
地质图
航磁解译地质图
遥感解译地质图
2.数据预处理
1)影像数据处理,主要针对原始影像数据
(1)将TM原始影像、SPOT原始影像、SAR原始影像、航磁等值线(.JPG)数据格式转换为ERDAS的.IMG格式。
(2)对转换后的IMG文件进行投影转换。投影系采用6度分带的横轴墨卡托(Transverse Mercator)投影,投影参数为:
Units:Meters
Scale Factor:1.0
Longitude Of Center:123 00 00
Latitude Of Center:0 00 00
False Easting:500 KM
False Northing:0 KM
Xshift:0
Yshift:0
椭球(spheroid)体采用克拉索夫(Krasovsky)椭球,参数为:
SemiMajor:6378245.0000 Meters
SemiMinor:6356863.0188 Meters
坐标系采用大地坐标,度量单位为米,这样可以在GIS系统中方便的量算特征的长度和面积。
(3)图像坐标纠正
参照地形图选择同名点,对影像数据进行坐标精校正。同名点的选择不少于12个。
2)矢量数据处理
工作主要针对地质图、航磁解译地质图、遥感解译单元图、遥感解译地质图。
(1)数据分层
根据图面特征信息内容和制图要求,每幅矢量图按特征类型划分为点、线、面(区)三个图层。划分的依据是遥感地质解译图件的信息不完全等同于其他地质调查图件,它表现的内容主要是:从影像图中判读出的地层、岩石影像单元及构造界线,但各种地质特征的单位、时代、分类、度量、结构、方向等的描述不是十分具体,因此在属性定义上比较一致,对一个图件不需要产生基于同一特征类型的专题图层,因此按矢量特征类型划分较为合理、简便。
(2)图件扫描矢量化
将地质、影像单元等图件扫描成 TIF影像文件,按照分层要求,将每个图件数字化为点、线、面三个图层文件。处理的图件和产生的矢量图层文件见表3-1至3-7。
表3-1 矢量图层表
1∶25万遥感地质填图方法和技术
c.面特征:由于影像单元图的面特征描述有其特殊之处,有时遵照地层、岩石的分类方法国家标准,但绝大部分是按照影像颜色、纹理等划分和称谓,因此进行分类编码十分困难,有待进一步研究解决。
以上编码方法是在每种特征类型组合最大值和预留一定的扩充余地的基础上编制的,编码方案参照国标:GB958—89区域地质图图例(1∶5万)
(6)属性定义
说明:由于地质代号的组成方式极为复杂,使用了上下角标、希腊字符、拉丁字母等,而这些字符和格式在纯文本的属性字段中是不能完全或准确表达的,因此在录入时对地质代号进行了一些简化。
例如:Pt2xh简化为Pt2xh
简化为An1—3
(二)建立数据库
GIS空间数据库有两种存储形式:一是基于文件索引的传统空间数据库管理体系;二是采用商用关系数据库的解决方案,二者各有千秋。第一种结构是对应用的集成,而数据是松散的,虽不利于数据的集中管理,但对不同系统平台之间共享数据提供了很大方便,特别是数据较少的小型应用系统。这种结构的另外一个可取之处是方案简单,工作量小,不需要数据库方面的专业知识。第二种结构既是应用的集成,也是数据的集成,并且提供所有的RDBMS的数据和安全管理优势,但它需要专用的空间数据引擎,对其他软件使用数据是一个极大的限制,必须进行数据的导入导出和格式转换,并且要求使用者对RDBMS有一定的操作和管理经验。
由于本集成系统采用的是ARC/INFO和ERDAS软件,它们之间只能达到文件方式的数据共享,虽然ARC/INFO 8提供了GeoDataBase这种关系数据库管理模式,实现真正的空间数据集中管理和RDBMS所有的数据管理能力,但为了满足两个软件之间数据的交互处理,本系统采用文件索引形式的数据库。在数据完备的基础上,建库工作需以下两个步骤:
(1)首先创建基于项目的不同格式、不同类型的目录树工作区,把所有数据文件分类保存在这个工作区中,工作区框架以瓦石峡幅数据为例(图3-5)。
(2)然后在 ARC/INFO 的 ARCMAP中新建一个 MAP DOCUMENT(以下简称为文档),添加所有数据文件到文档中。文档中每个数据文件都被称为一个 LAYER(以下简称为层),每个矢量层可以有它自己的环境,文档可以保存环境的变化。使用者只需打开这个文档即可调用项目所有的数据文件,并且恢复到上一次工作时的状态。
图3-5 数据分层结构图
在MAP DOCUMENT这种集成的数据环境下,使用者可以采用ARC/INFO 8的ARCEDITOR、ARCMAP参照影像图层进行矢量化的解译工作,对已形成的图件直接进行图形和属性编辑,进行辅助解译的空间分析,对各种图件进行叠加比较,使用文字标签或属性字段标注特征,按照分类符号化特征,制作专题图,打印输出图件报表等,实现一系列与遥感解译有关的功能和操作。
由于ARC/INFO提供的地质图式图例和符号不能满足我国的地质成图要求,因此制图软件采用地质行业较为通用的MAPGIS。通过ARCTOOLS工具将最终的解译成果矢量地质图转换为ARC/INFO的标准交换格式E00,提交给MAPGIS形成绘图文件,出版印刷。具体的实施方案和技术流程见“成果图件制作方法研究”一节。
Ⅲ 天津市地质资料信息化服务研究
张惠生1 马锋1 杨书畅2
(1.天津市地质资料馆;2.天津市国土资源和房屋管理局)
摘要 本文概略讲述了在开展地质资料信息服务方面的工作思路、工作内容以及部分拟开展的工作。通过调研,了解不同的地质信息需求,进行服务对象分类,在地质资料信息集成的基础上,建立地质资料信息服务平台、网络,利用内网、互联网等方式开展有针对性的地质资料信息服务,以促进天津市的经济建设。
关键词 地质资料 社会化服务 地质信息服务平台
从2002年开始,天津市陆续开展了地质资料目录数据库建设、成果地质资料数字化、钻孔基本信息清查、重要地质钻孔数据库建设等工作,不断提高地质资料数字化管理。建立了天津市地质资料馆网站,开发了地质资料数据中心服务平台,初步搭建了地质资料信息化服务平台。从数据和平台两个方面为地质资料信息化服务奠定了基础。
1 服务对象
在《推进地质资料信息服务集群化产业化工作方案》(国土资发〔2010〕113号)文件中,一个基本原则是坚持公共服务。充分考虑社会公众、政府管理、科学研究、企业发展的需求。通过需求调研和分析,服务对象主要分3个层面:企事业单位层面、政府层面和公众层面。企事业单位层面包括与地质工作相关的城建、规划、测绘、环保、地勘、交通部门的科研院所、大专院校等企事业单位;政府层面包括城市规划和国土资源管理、城市建设、水务管理、海洋管理、环境保护管理、农林业管理、地震管理等管理部门;社会公众层面为需要了解地质相关情况的人员。
2 服务需求
通过调研,不同层面的服务对象对地质资料的需求存在差异。企事业单位层面主要从技术方面考虑,结合所承担的工作或者研究课题,需要的是在地质工作中形成的地质数据、地质成果、地质理论和观点等;政府层面主要从管理方面考虑,需要地质工作中形成的成果,开展决策、实施等管理;公众层面主要从兴趣方面考虑,了解相关的地质科普知识。
3 数字化数据整理
经过多年的数字化信息化工作,形成或正在形成的数字化存储数据分为三个方面。
一是地质工作中形成的文件资料。①成果地质资料。报告正文、附图、附表、附件、评审意见等,目前全部实现数字化存储,2003年之前的成果地质资料通过扫描以图片格式存储,2003年之后按照电子文件汇交格式进行存储。②原始地质资料。部分项目的原始地质进行了汇交,拟同处理2003年之前汇交的成果地质资料一样,通过开展扫描数字化工作后以图片格式存储。③实物地质资料。逐步通过照片、扫描等方式进行资料存储。
二是地质资料管理中形成的文件资料。成果地质资料目录数据库,包括资料名称、形成时间、形成单位、主要编着者、内容介绍等;原始地质资料目录,各个原始地质资料文件的名称;实物地质目录,每个项目形成的实物地质资料清单。地质资料元数据库,某一份地质资料的元数据信息,包括基本信息、标识信息、数据质量、内容信息等方面的信息。
三是地质信息集群化形成的信息数据。天津市三维地质信息系统建设地质资料信息集群化成果,包括各类各专业的基础数据和图件;利用三维地质信息系统的各项功能新形成的地质资料信息,包括生成的钻孔柱状图、剖面图、统计数据,各地质专业分析评价模型形成图件、三维地质结构模型形成的地质模型等。地质钻孔基本信息清查数据库,重要地质钻孔数据库等信息。
4 在线数据上传与展示
目前对在线服务的定位于介绍、推介、引导地质资料的查询和利用。基于这种定位,对整理的数字化资料按照分类管理和用户需求进行上传,以满足用户实现网上利用服务。对三类不同的资料,通过不同方式的服务以满足不同层面用户的需求。对第一类资料选择可公开的公益性资料、科普类、科技类资料,上传到信息服务平台,对政府层面需要的成果、图件等资料,通过编辑处理,去除涉密要素、涉密数据后,形成可满足需要的成果、图件;对第二类资料全部上网,满足用户对地质资料基本信息的查询;对第三类资料有选择地进行深加工后上传,深加工包括钻孔地层标准化、钻孔位置的校正、图形比例的校正等工作,满足专业用户的资料需求。
上传后的地质数据和基础地理数据相结合,开发基于WebGIS的空间数据展示功能,包括地图显示与输出、地质成果图件展示与管理、钻孔数据空间查询与信息显示等功能。例如通过拉框选择该区域的地质资料目录、钻孔,并进一步读取详细的资料;对分析评价模型的展示等。
5 数据服务方式
不论是地质资料馆网站还是地质资料数据中心服务平台,都是通过互联网为用户提供快捷、满意的服务。在提供服务的同时,既要考虑互联网的方便快捷,也要考虑地质资料的安全稳妥。首先坚持涉密地质资料不上互联网;其次采用分级管理模式,即分为游客、注册用户、高级注册用户进行分类管理,不同类别用户具有不同的权限,提供不同深度内容的服务。
6 服务制度建设
随着科技的不断发展,新的方法、新的工具不断应用,同时要更新完善相关制度,以适应时代的要求。例如建立信息服务平台管理制度、网络安全制度、数据安全制度、数据维护制度、数据服务利用制度等,以保证地质信息服务的规范、安全和高效。
总之,利用数据库技术、GIS技术、三维可视化技术和计算机网络技术,优化地质信息服务模式,使地质资料信息资源能够被便捷、有效地浏览和利用,形成为城市建设、土地利用、矿产资源开发和地质环境保护等服务的地质信息平台,更好地服务于天津市的经济建设。
Ⅳ 大数据工程师进行数据平台建设 有哪些方案
【导语】数据平台其实在企业发展的进程中都是存在的,在进入到数据爆发式增加的大数据时代,传统的企业级数据库,在数据管理应用上,并不能完全满意各项需求。就企业自身而言,需求更加契合需求的数据平台建设方案,那么大数据工程师进行数据平台建设,有哪些方案呢?下面就来细细了解一下吧。
1、敏捷型数据集市
数据集市也是常见的一种方案,底层的数据产品与分析层绑定,使得应用层可以直接对底层数据产品中的数据进行拖拽式分析。数据集市,主要的优势在于对业务数据进行简单的、快速的整合,实现敏捷建模,并且大幅提升数据的处理速度。
2、常规数据仓库
数据仓库的重点,是对数据进行整合,同时也是对业务逻辑的一个梳理。数据仓库虽然也可以打包成SAAS那种Cube一类的东西来提升数据的读取性能,但是数据仓库的作用,更多的是为了解决公司的业务问题。
3、Hadoop分布式系统架构
当然,大规模分布式系统架构,Hadoop依然站在不可代替的关键位置上。雅虎、Facebook、网络、淘宝等国内外大企,最初都是基于Hadoop来展开的。
Hadoop生态体系庞大,企业基于Hadoop所能实现的需求,也不仅限于数据分析,也包括机器学习、数据挖掘、实时系统等。企业搭建大数据系统平台,Hadoop的大数据处理能力、高可靠性、高容错性、开源性以及低成本,都使得它成为首选。
4、MPP(大规模并行处理)架构
进入大数据时代以来,传统的主机计算模式已经不能满足需求了,分布式存储和分布式计算才是王道。大家所熟悉的Hadoop
MapRece框架以及MPP计算框架,都是基于这一背景产生。
MPP架构的代表产品,就是Greenplum。Greenplum的数据库引擎是基于Postgresql的,并且通过Interconnnect神器实现了对同一个集群中多个Postgresql实例的高效协同和并行计算。
关于大数据工程师进行数据平台建设方案的有关内容,就给大家介绍到这里了,中国社会发展至今,大数据的应用正在逐渐普及,所以未来前景不可估量,希望想从事此行业的人员能够合理选择。
Ⅳ 数据库建设数据流程
中国地热资源数据库建设工作必须按照其数据组成及属性表规定的数据格式的具体要求,在对相关数据资料进行整理的基础上,按照制定的数据卡片逐项填写内容。并在建立健全检查制度的基础上,确保数据卡片的内容详实、准确。再在 Access 系统中完成属性数据的录入,并进行校核。图形的数字处理在 MapGIS 系统中完成 ( 图 2-5) 。
图 2-5 中国地热资源数据库建设数据流程
Ⅵ 数据库建设方面
在全面收集了研究区的地、物、化、遥以及所产出的矿床地质特征资料的基础上,完成研究区系统和详细的工作区研究程度图,详细地勾勒了全区总的已经开展的工作状况。
完成中国地质调查局的关于数据库和图库建设的任务,完成了西南三江中段矿产地质数据库,该地质数据库由地质图数据库、矿产地数据库、地理底图数据库、物探数据库(包括重力数据库和航磁数据库)、化探数据库、遥感构造解译数据库六大子库构成。数据库建设的主要进展包括:①完成研究区457个矿床(点)资料收集(四川272个、西藏185个);②完成了研究区1:2.5万图幅-数据点区域化探数据(共2364个数据点)及藏东和川西地区1:20万区域化探数据36个分幅的数据库收集和建设,并利用多种方法进行必要的数据处理和元素分布背景分析,取得满意的效果;③建立了西南三江中段重力数据库和重力场数据库;④完成 Landsat TM 图像处理,图像波段组合采用 TM543(RGB)进行假彩色合成,同时进行必要的和详细的线、环构造解译;⑤以MapGIS为基础平台,采用VB为开发工具实现二次开发,初步完成了一个针对本区各个子库的管理系统,主要完成各个子库的统一管理及浏览功能;⑥完成三江中段矿产地质数据库成果文件的详细分类。
Ⅶ 数据平台建设的方案有哪几种
1、常规数据仓库
数据仓库的重点,是对数据进行整合,同时也是对业务逻辑的一个梳理。数据仓库虽然也可以打包成SAAS那种Cube一类的东西来提升数据的读取性能,但是数据仓库的作用,更多的是为了解决公司的业务问题。
2、敏捷型数据集市
数据集市也是常见的一种方案,底层的数据产品与分析层绑定,使得应用层可以直接对底层数据产品中的数据进行拖拽式分析。数据集市,主要的优势在于对业务数据进行简单的、快速的整合,实现敏捷建模,并且大幅提升数据的处理速度。
3、MPP(大规模并行处理)架构
进入大数据时代以来,传统的主机计算模式已经不能满足需求了,分布式存储和分布式计算才是王道。大家所熟悉的Hadoop MapRece框架以及MPP计算框架,都是基于这一背景产生。
MPP架构的代表产品,就是Greenplum。Greenplum的数据库引擎是基于Postgresql的,并且通过Interconnnect神器实现了对同一个集群中多个Postgresql实例的高效协同和并行计算。
4、Hadoop分布式系统架构
当然,大规模分布式系统架构,Hadoop依然站在不可代替的关键位置上。雅虎、Facebook、网络、淘宝等国内外大企,最初都是基于Hadoop来展开的。
Hadoop生态体系庞大,企业基于Hadoop所能实现的需求,也不仅限于数据分析,也包括机器学习、数据挖掘、实时系统等。企业搭建大数据系统平台,Hadoop的大数据处理能力、高可靠性、高容错性、开源性以及低成本,都使得它成为首选。
关于数据平台建设的方案有哪几种,环球青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。
Ⅷ 创建数据库的两种方法
创建数据库有两种方式:
1.用图形界面创建数据库
数据库(Database)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。
简单来说是本身可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。
拓展资料:
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。