1. 空间数据库的组成部分
空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。《空间数据库》范围及重点 1. 第一章:绪论 1) 空间数据库基本概念、组成部分、名称简写之间的联系与区别与联系; 答;利用当代的系统方法,在地理学、地图学原理的指导下,对地理空间进行科学的认识与抽象,将地理数据库化为计算机处理时所需的形式与结构,形成综合性的信息系统技术——空间数据库 或者SDBMS是海量SD的存储场所、提供SD处理与更新、交换与共享,实现空间分析与决策的综合系统。 组成:存储系统、管理系统、应用系统 是SDBS的简称 2) 目前空间数据库实现方案; 答:ORDBMS 3) GIS,RS与空间数据库之间的联系; 4) 常见的空间数据库产品 答:轻量级: MS的Access、FoxPro、 SUN的MySQL 中等:MS的SQL Server系列 重量级:Oracle的Oracle 不太熟悉的有: Sybase、Informix、DB2 、Ingress、 PostgreSQL(PG)等 5) 产生空间数据库的原因; 答:直接利用? SD特征 :空间特性 非结构化特征 空间关系特征 多尺度与多态性 海量数据特性 存在的问题:复杂图形功能:空间对象 复杂的空间关系 数据变长记录 6)空间数据库与普通关系数据库的主要区别。 答:关系数据库管理属性数据,空间数据采用文件库或图库形式;增加大二进制数据类型(BLOB),解决变长数据存储问题;将空间数据/属性数据全部存放在数据库中;但空间特性由程序处理 2. 第二章:空间数据库模型 1) 如何理解空间数据库模型; 2) 空间数据及空间关系; „ (1) 空间数据类型 几何图形数据 影像数据 属性数据 地形数据 元数据:对空间数据进行推理、分析和总结得到的关于数据的数据, 数据来源、数据权属、数据产生的时间 数据精度、数据分辨率、元数据比例尺 地理空间参考基准、数据转换方法… (2) 空间关系 指地理空间实体之间相互作用的关系: 拓扑关系:形状、大小随投影改变。在拓扑变换下不变的拓扑变量,如相邻、包含、相交等,
反映空间连续变化的不变性 方位关系:地理空间上的排列顺序,如前后、上下、左右和东、南、西、北等方位 度量关系:距离远近等 3) 空间数据库如何建模; DB设计三步骤 ‹ Conceptual Data Model:与应用有关的可用信息组织、数据类型、联系及约束、不考虑细节、E-R模型 Logic Data Model 层次、网状、关系,都归为关系,SQL的关系代数(relational algebra, RA) Physical Data Model:解决应用在计算机中具体实现的各种细节,计算机存储、数据结构等 4) 模型之间如何转换? 5) 可行的空间数据库建模方案。 面向对象的空间数据库模型GeoDatabase 3. 第三章:空间数据库存储与索引 1) 空间数据如何组织、存储的,采用什么技术或者方法; 为有效表达空间信息内容,空间数据必须按照一定的方式进行组织与存储:适合外存操作的数据结构、记录和文件的多种组织方式 SDB空间数据组织:数据项、记录、文件、数据库 SDB空间数据存储:二级存储器、缓冲区管理器、空间聚类(clustering)、空间索引 2) 空间近似与空间聚类; 目的:降低响应大查询的寻道时间和等待时间,在二级存储中空间上相邻的/查询上有关联的空间对象在物理上存放在一起, 内部聚类(internal clustering):加快单个对象的访问,一个对象都存放在一个磁盘块(页面);如超出则存放在连续扇区,本地聚类(local clustering):加快多个对象访问。一组空间相邻对象存放在一个页面 空间聚类比传统聚类技术复杂。多维空间对象无天然的顺序 磁盘:一维存取,高维:将高维映射到一维, 一一对应,保持距离(distance preserving):一一对应,容易;距离不变,近似,映射技术、Z序(z-order)、Hilbert曲线 3) 空间数据库性能提升的关键问题是什么?如何提升; 数据库索引,基于树:ISAM、B树、B 树等,基于Hash:静态、可扩展、线性等 4) 空间索引技术是什么?为什么产生?有哪些常见的空间索引;各有何特点及适用范围? 依据空间对象的位置和形状或者空间对象之间的空间关系,按一定顺序排列的一种数据结构,介于空间操作算法和空间对象之间,通过筛选,大量与特定空间操作无关的空间对象被排除,提高效率,空间数据库关键的技术 空间索引产生的原因:空间数据的特点:空间定位、空间关系、多维、多尺度、海量、复杂,传统数据库索引处理的一维的字符、数字,对多维处理采用组合字段 1、基于二叉树的索引技术:二分索引树结构主要用于索引多维数据点;对复杂空间目标(线、面、体等)的索引却必须采用近似索引方法和空间映射技术 2、 基于B树的索引技术 ‹B树的变体如R树系列,外包矩形;对大型数据库具有出色表现;需要解决:减少区域重叠,提高搜索效率 3、基于哈希的网格技术
2. 空间数据库
(一)区域级潜力与适宜性空间数据库
1.数据库设计
区域级评价空间数据库采用了MapGIS数据管理技术和Geodatabase技术,数据保存为MapGIS数据、ShipeFile、文件和Access数据库,见表12-2。
数据比例尺为1∶500万,采用投影坐标WGS84。
数据来源:全国1:500万矢量数据、全国1∶100万矢量数据、遥感影像数据、Dem数据、搜集的各娄图件、数据标准化获得的数据和区域级评价成果数据等;
数据格式:Shape File、Geodatabase、Raster(Grid、Tiff、Image)、MapGIS等;
数据处理步骤及方法:收集资料、划分图层、维护属性表、配准并矢量化图形、设置可视化参数、属性关联、投影变换;
数据容量:Geodatabase(Access、Shape File)共1G;Raste(r卫星影像、DEM)共计500G;处理后的数据共计约600G;
数据内容:共63个全国基础地理矢量图层;78个评价专题图层;Dem数据;卫星影像数据。
数据库主要成果图层属性字段设置示例见表12-2。
表12-2 区域级评价主要成果图层属性字段设置示例
续表
3. 简述空间数据的处理包括哪些内容
主要取决于原始数据的特点和用户的具体需求。通常有数据变换、数据重构、数据提取等内容。
空间数据是用于描述所定义空间中对象的位置、形状和方向的数据,空间数据有十分复杂的结构,一个空间数据实体可能由一个点或几个多边形组成,是任意分布在空间中的,通常不可能在一个单独的有固定元组大小的表格中存取这些实体。
对空间数据执行的两个常见操作是计算几何之间的距离和确定多个对象之间的联合或相交。
(3)空间数据库复习资料扩展阅读:
注意事项:
1、空间数据通常是活动的。插入,删除与更新是交替进行的。
2、空问数据库通常很大,例如典型的地图会占用巨大的存储空间,因此,一、二、三级内存对于高效率的过程是必须的。
3、没有一个标准的代数定义来描述空间数据。运算符号的应用很大程度上取决于给定的应用领域。尽管一些符号比其他的应用普遍一些。
4、许多空间符一号并不是封闭的。例如两个多边形的交运算可能会返回一些点、交叉的边或没有交集的多边形。
5、尽管计算代价因空间数据库运算符的不同而不同,通常都比传统的运算符的耗费大。
参考资料来源:网络-空间数据
4. 空间数据库的空间数据库的特点
1、数据量庞大。
空间数据库面向的是地理学及其相关对象,而在客观世界中它们所涉及的往往都是地球表面信息、地质信息、大气信息等及其复杂的现象和信息,所以描述这些信息的数据容量很大,容量通常达到 GB级。
2、具有高可访问性 。
空间信息系统要求具有强大的信息检索和分析能力, 这是建立在空间数据库基础上的,需要高效访问大量数据。
3、空间数据模型复杂
空间数据库存储的不是单一性质的数据,而是涵盖了几乎所有与地理相关的数据类型,这些数据类型主要可以分为 3 类:
(1)属性数据:与通用数据库基本一致,主要用来描述地学现象的各种属性,一般包括数字、文本、日期类型。
(2)图形图像数据:与通用数据库不同,空间数据库系统中大量的数据借助于图形图像来描述。
(3)空间关系数据:存储拓扑关系的数据,通常与图形数据是合二为一的。
4、属性数据和空间数据联合管理。
5、空间实体的属性数据和空间数据可随时间而发生相应变化。
6、空间数据的数据项长度可变,包含一个或多个对象,需要嵌套记录。
7、一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。
8、具有空间多尺度性和时间多尺度性。
9、应用范围广泛。
空间数据库的设计
5. 地质图空间数据库各要素内容
基于 PRB 数据模型和地理数据库数据模型的地质图空间数据库将地质图对象划分为基本要素数据集、综合要素数据集、对象要素数据集和独立要素数据集,包括 15 个基本要素类、8 个综合要素、12 个对象类、5 个独立要素数据集构成。
(1)基本要素数据集
基本要素数据集主要包括: 地质体面实体(Geopygon)、地质界线(Geoline)、脉岩(Dike )、 蚀变(点)(Alteration)、 矿 产 地(Mineral pnt )、 产 状(Attitude )、 样 品(Sample)、照片(Photo)、素描(Sketch)、化石(Fossil)、同位素年龄(Isotope)、火山口(Crater)、钻孔(Drillhole)、泉(Spring)、河流海岸线(Coasting)。
(2)综合要素数据集
综合要素数据集主要包括: 构造变形带(Tecozone)、蚀变带(面)(Alteration)、变质相带(Metamor_ facies)、混合岩化带(Migmat)、矿化带(Minerak_ zone)、火山岩岩相(Volca_ facies)、滑坡体(Landslide)、标准图框(Map_ frame)。
(3)对象数据集
对象数据集主要包括: 沉积(火山)地层单位(Stratums)、侵入岩岩石年代单位(Intru _ litho _ chrono)、侵入岩谱系单位(Intru _ pedigree)、变质岩地(岩)层单位(Metamorphic)、特殊地质体(Special_ geobody)、非正式地层单位(Inf_ strata)、断层(Fault)、脉岩(Dike_ object)、戈壁沙漠(Desert)、冰川与终年积雪(Firn_ glacier)、面状水体与沼泽(Water_ region)、图幅基本信息(Mapinfo)。
(4)独立要素数据集
独立要素数据集包括: 图切剖面(Cutting_profile)、综合柱状图(Syhthetical_column)、图例(Legend)、接图表(Map_ sheet)、责任表(Duty_ table)。