当前位置:首页 » 数据仓库 » 图像数据库怎样构建
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

图像数据库怎样构建

发布时间: 2022-08-25 06:09:52

㈠ 基础数据库

(一)数据内容

基础数据库包括系统运行前所采集到的所有支撑数据,数据的具体内容在数据分类与数据源章节中已描述,概括可分为以下几类。

(1)遥感影像数据:包括历史图像数据,以及按照一定监测周期更新的遥感图像数据。

(2)数字线划图数据:矢量数据(现状专题图和历史专题图数据)、栅格数据、元数据等。入库前数据以ArcInfoCoverage格式分幅或整体存储,采用地理坐标系统。

(3)数字栅格图数据:包括1∶5万和1∶10万基础地理图形数据的扫描栅格数据。

(4)数字高程模型数据:塔里木河干流河道1∶1万和“四源一干”区域1∶10万数字高程模型。

(5)多媒体数据:考察照片、录像、录音和虚拟演示成果等多媒体资料。

(6)属性数据:社会经济与水资源数据、水利工程数据、生态环境数据等。

(二)数据存储结构

1.栅格数据

栅格数据包括遥感影像、数字栅格图、数字正射影像图、数字高程模型等,这些数据的存储结构基本类似,因此可进行统一设计。遥感图像数据库与普通的图像数据库在存储上有些差别,遥感图像作为传感器对地理、空间环境在不同条件下的测量结果(如光谱辐射特性、微波辐射特性),必须结合同时得到的几个图像才可以认为是对环境在一定的时间条件下的完整的描述,也即是说,可能需要一个图像集合才能构成一个图像的完整的概念,并使之与语义信息产生联系(罗睿等,2000)。因此,遥感图像数据存储结构模型必须能够描述几个图像(波段)之间的逻辑关系。利用ArcSDE进行数据入库时,系统可自动建立各图像(波段)之间的关系,并按一定规则存储在数据库系统中。

对栅格数据在后台将采用Oracle数据库管理系统进行存储。Oracle系统可直接存储影像信息,并具有较强的数据管理能力,可以实现栅格数据信息的快速检索和提取。数据引擎采用ArcSDE,实现各类影像数据的入库。数据存储的关键是建立图幅索引,本系统数据的存储按图幅号、图名、采集时间等内容建立索引。

栅格数据依据图形属性一体化的存储思想,采用大二进制格式直接存储数据,这种方式的存储可实现内容的快速检索查询,按索引表检索出相关项后可直接打开栅格数据,提高栅格数据的管理效率。

2.矢量数据

本系统采用图属一体化思想即将空间数据和属性数据合二为一,全部存在一个记录集中的思想存储空间数据,是目前GIS数据非常流行的存储方法。考虑到数据的具体情况,决定采用数据库存储空间数据和属性数据,部分具有少量、定型几何信息的地理要素如水文测站、河流、湖泊等,采用图属一体化思想存储其信息,而与其有关联关系的大量、多边化的属性信息如水文信息,则存储在属性数据表中,利用唯一标识符信息建立两表的关联。

针对本系统空间数据的特点,系统按照“数据库—子库—专题(基础数据)—层—要素—属性”的层次框架来构筑空间数据库,按照统一的地理坐标系统来存储空间数据,以实现对地理实体/专题要素进行分层叠加显示。

3.多媒体数据

Oracle系统可直接存储图片和视频信息,并具有较强的数据管理能力,可以实现多媒体信息的快速检索和提取。多媒体数据存储的关键是建立索引表,本系统多媒体数据的存储按类型、时间、内容等项目建立索引,直接存储于Oracle数据库中。

多媒体数据存储时,可以将多媒体内容与索引表结构合为一体,采用大二进制格式直接存储,这种存储方式可实现内容的快速检索和查询,按索引表检索出相关项后可直接打开多媒体内容,而且多媒体数据库也便于维护管理。

(三)空间索引设计

1.矢量空间索引

确定合适的格网级数、单元大小是建立空间格网索引的关键。格网太大,在一个格网内有多个空间实体,查询检索的准确度就低。格网太小,则索引数据量成倍增长和冗余,检索的速度和效率低。每一个数据层可采用不同大小、不同级别的空间索引格网单元,但每层级数最多不能超过三级。索引方式设置遵循以下基本原则:

(1)对于简单要素的数据层,尽可能选择单级索引格网,减少RDBMS搜索格网单元索引的级数,缩短空间索引搜索的过程;

(2)如果数据层中的要素封装边界大小变化比较大,应选择2或3级索引格网;

(3)如果用户经常对图层执行相同的查询,最佳格网的大小应是平均查询范围的1.5倍;

(4)格网的大小不能小于要素封装边界的平均大小。为了减少每个格网单元有多个要素封装边界的可能性,格网单元的大小应取要素封装边界平均大小的3倍;

(5)格网单元的大小不是一个确定性的问题,需要多次尝试和努力才会得到好的结果。有一些确定格网初始值的原则,用它们可以进一步确定最佳的格网大小。

SDE(Spatial Data Engine,即空间数据引擎),从空间管理的角度看,是一个连续的空间数据模型,可将地理特征的空间数据和属性数据统一集成在关系型数据库管理系统中。关系型数据库系统支持对海量数据的存储,从而也可实现对空间数据的海量存储。空间数据可通过层来进行数据的划分,将具有共同属性的一类要素放到一层中,每个数据库记录对应一层中一个实际要素,这样避免了检索整个数据表,减少了检索的数据记录数量,从而减少磁盘输入/输出的操作,加快了对空间数据查询的速度。

ArcSDE采用格网索引方式,将空间区域划分成合适大小的正方形格网,记录每一个格网内所包含的空间实体(对象),以及每一个实体的封装边界范围,即包围空间实体的左下角和右上角坐标。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后通过格网号,就可以快速检索到所需的空间实体。因此确定合适的格网级数、单元大小是建立空间格网索引的关键,太大或太小均不合适,这就需要进行多次尝试,确定合适的网格大小,以保证各单元能均匀落在网格内。利用ArcSDE的索引表创建功能,记录每一网格单元的实体分布情况,形成图层空间索引表。根据空间索引表,ArcSDE实现了对空间数据的快速查询。

2.栅格数据空间索引

栅格数据的空间索引通过建立多级金字塔结构来实现。以高分辨率栅格数据为底层,逐级抽取数据,建立不同分辨率的数据金字塔结构,逐级形成较低分辨率的栅格数据。该方法通常会增加20%左右的存储空间,但却可以提高栅格数据的显示速度。在数据库查询检索时,调用合适级别的栅格数据,可提高浏览和显示速度。

(四)入库数据校验

入库数据的质量关系到系统评价分析结果的准确性。数据在生产中就需要严格进行质量控制。依据数据生产流程,将数据质量控制分成生产过程控制和结果控制。生产过程控制包括数据生产前期的质量控制、数据生产过程中的实时质量控制,结果质量控制为数据生产完成后的质量控制(裴亚波等,2003)。对入库数据的校验主要是进行数据生产完成后的质量控制和检查。

1.规范化检查

(1)代码规范化:所有地理代码尽量采用国家标准和行业标准,例如,行政代码采用中华人民共和国行政区划代码国标。

(2)数据格式规范化:所有数据采用标准交换数据格式,例如,矢量数据采用标准输出Coverage格式和E00格式。

(3)属性数据和关系数据字段规范化:所有属性数据和关系数据提前分门别类地设计字段的内容、长短和格式,操作过程中严格执行。

(4)坐标系统规范化:本系统所有与空间有关的数据采用统一的空间坐标系统,即地理坐标系统。

(5)精度规范化:所有数据按照数据精度与质量控制中所要求的精度进行采集和处理。

(6)命名规范化:所有数据按照命名要求统一命名,便于系统的查询。

(7)元数据规范化:依照元数据标准要求,进行元数据检查。

2.质量控制

数据质量是GIS成败的关键。对于关系型数据库设计,只要能保证表的实体完整性和参照完整性,并使之符合关系数据库的三个范式即可。对于空间数据库设计,则不仅要考虑数据采样、数据处理流程、空间配准、投影变换等问题,还应对数据质量做出定量分析。

数据质量一般可以通过以下几个方面来描述(吴芳华等,2001):

(1)准确度(Accuracy):即测量值与真值之间的接近程度,可用误差来衡量;

(2)精度(Precision):即对现象描述得详细程度;

(3)不确定性(Uncertainty):指某现象不能精确测得,当真值不可测或无法知道时,就无法确定误差,因而用不确定性取代误差;

(4)相容性(Compatibility):指两个来源不同的数据在同一个应用中使用的难易程度;

(5)一致性(Consistency):指对同一现象或同类现象表达的一致程度;

(6)完整性(Completeness):指具有同一准确度和精度的数据在类型上和特定空间范围内完整的程度;

(7)可得性(Accessibility):指获取或使用数据的容易程度;

(8)现势性(Timeliness):指数据反映客观现象目前状况的程度。

塔里木河流域生态环境动态监测系统的所有数据在数据质量评价后,还需要从数据格式、坐标一致性等方面进行入库质量检验,只有通过质量检验的数据才可以入库。

3.数据检验

空间数据质量检验包括以下步骤:

(1)数据命名是否规范,是否按设计要求命名;

(2)数据是否能够正常打开;

(3)投影方式是否正确;

(4)坐标系统是否正确;

(5)改错是否完成,拓扑关系是否建立;

(6)属性数据是否正确,包括字段设置是否依据设计进行、是否有空属性记录、是否有属性错误记录等。

关系数据质量检验包括以下步骤:

(1)数据命名是否规范,是否按设计要求命名;

(2)数据是否能够正常打开;

(3)数据字段是否按设计要求设置;

(4)是否有空属性记录;

(5)是否有属性错误记录。

属性数据的校验,主要采用以下三种方式:

(1)两次录入校验:对一些相互之间毫无关联的数据,进行两次的录入,编写程序对两次录入的结果进行比较,找出两次录入结果不一样的数据,查看正确值,进行改正。

(2)折线图检验:对一些相互之间有关联的序列数据,如人口统计数据,对这一类数据,编写程序把数据以折线图的形式显示在显示器上,数据的序列一般都有一定规律,如果出现较大的波动,则需对此点的数据进行检查修改。

(3)计算校验:对一些按一定公式计算后所得结果与其他数据有关联的数据,如某些数据的合计等于另一数据,编写程序对这类数据进行计算,计算结果与有关联的数据进行比较,找出结果不一样的数据,查看正确值,进行改正。

图形数据的校验,主要包括以下步骤(陈俊杰等,2005):

(1)图层校验:图形要素的放置图层是唯一的。对于入库的Coverage数据,系统将根据图层代码进行检查,确保图形要素对层入座。

(2)代码检查:图形要素的代码是唯一的。对于入库的Coverage数据,系统将根据入库要素代码与特征表中的代码进行比较,确保入库数据代码存在,杜绝非法代码入库。

(3)类型检查:对入库的数据,检查该要素的类型与特征表中的类型是否一致,确保图形要素对表入座。如点要素、线要素、面要素仅能赋相应的点、线、面代码,且该代码必须与特征表中的数据类型代码相同。

(4)范围检查:根据入库的数据,确定该类要素的大体范围(如X、Y坐标等),在数据入库前,比较入库数据与范围数据的大小,若入库数据在该范围内,则入库,否则给出提示检查信息。

(五)数据入库

1.遥感影像数据

利用空间数据引擎———ArcSDE可实现遥感影像数据在Oracle数据库中的存储和管理,在影像数据进行入库时,应加入相应的索引和影像描述字段。

遥感影像入库步骤:

(1)影像数据预处理:要将塔里木河遥感影像数据库建成一个多分辨率无缝影像数据库系统,客观上要求数据库中的影像数据在几何空间、灰度空间连续一致。因此,在数据采集阶段就需要对影像数据进行预处理,包括图像几何校正、灰度拼接(无缝镶嵌)、正射处理、投影变换等。

几何校正的目的是使校正后的图像重新定位到某种地图投影方式,以适用于各种定位、量测、多源影像的复合及与矢量地图、DTM等的套合显示与处理。几何校正多采用二次多项式算法和图像双线性内插重采样法进行图像校正。将纠正后具有规定地理编码的图像按多边形圈定需要拼接的子区,逐一镶嵌到指定模版,同时进行必要的色彩匹配,使整体图像色调一致,完成图像的几何拼接,再采用金字塔影像数据结构和“从粗到精”的分层控制策略实现逐级拼接。

数字正射影像具有统一的大地坐标系、丰富的信息量和真实的景观表达,易于制作具有“独立于比例尺”的多级金字塔结构影像。可以采用DTM和外方位元素经过数字微分纠正方法,获得数字正射影像,它的基本参数包括原始影像与正射影像的比例尺、采样分辨率等(方涛等,1997)。

投影变换需根据数据库系统定义的标准转换到统一的投影体系下。

(2)影像数据压缩:随着传感器空间分辨率的提高和对遥感信息需求的日益增长,获取的影像数据量成几何级数增大,如此庞大的数据将占用较大的存储空间,给影像的存储和传输带来不便(葛咏等,2000)。目前,系统处理的遥感影像数据已达数百千兆,单个文件的影像数据最大达到了2G,这样的数据量在调用显示时速度很慢,对影像数据进行压缩存储,将大大提高影像访问效率。本系统采用ArcSDE软件提供的无损压缩模式对入库影像进行压缩。

(3)影像导入:遥感影像的入库可通过ArcSDE或入库程序进行导入,并填写相关的索引信息,在入库时对大型的遥感影像数据进行自动分割,分为若干的块(tiles)进行存储。

(4)图像金字塔构建:采用ArcSDE提供的金字塔构建工具在入库时自动生成图像金字塔,用户只需要选择相应的参数设置即可。图像金字塔及其层级图像按分辨率分级存储与管理。最底层的分辨率最高,并且数据量最大,分辨率越低,其数据量越小,这样,不同的分辨率遥感图像形成了塔式结构。采用这种图像金字塔结构建立的遥感影像数据库,便于组织、存储与管理多尺度、多数据源遥感影像数据,实现了跨分辨率的索引与浏览,极大地提高了影像数据的浏览显示速度。

2.数字线划图

对纸图数字化、配准、校正、分层及拼接等处理后,生成标准分幅和拼接存储的数字矢量图,就可以进行图形数据入库。

(1)分幅矢量图形数据、图幅接合表:按图形比例尺、图幅号、制作时间、图层等方式,通过入库程序导入到数据库中,同时导入与该地理信息相对应的属性信息,建立空间信息与属性信息的关联。

(2)拼接矢量图形数据:按图形比例尺、制作时间、图层等方式,通过入库程序导入到数据库中,同时导入与该地理信息相对应的属性信息,建立空间信息与属性信息的关联。

3.栅格数据

对纸图数字化、配准、校正、分层及拼接等处理后,生成标准分幅和整体存储的数字栅格图,然后进行图形数据入库。

(1)分幅栅格图形数据、图幅接合表:按图形比例尺、图幅号、制作时间等方式,通过入库程序导入到数据库中。

(2)整幅栅格图形数据:按比例尺、制作时间等方式,通过入库程序导入到数据库中。

4.数字高程模型

(1)分幅数字高程模型数据、图幅接合表:按图形比例尺、图幅号、制作时间等方式,通过入库程序导入到数据库中。

(2)拼接数字高程模型数据:按比例尺、制作时间等方式通过入库程序导入到数据库中。

5.多媒体数据

多媒体数据入库可根据多媒体数据库内容的需要对入库数据进行预处理,包括音频、视频信息录制剪接、文字编辑、色彩选配等。对多媒体信息的加工处理需要使用特定的工具软件进行编辑。由于音频信息和视频信息数据量巨大,因此,对多媒体数据存储时需采用数据压缩技术,现在的许多商用软件已能够直接存储或播放压缩后的多媒体数据文件,这里主要考虑根据数据显示质量要求选择采用不同的存储格式。图4-2为各类多媒体数据的加工处理流程。

图4-2 多媒体数据加工处理流程图

6.属性数据

将收集的社会经济、水利工程、生态环境等属性资料,进行分析整理,输入计算机,最后经过程序的计算处理,存储到数据库中,具体流程如图4-3所示。

图4-3 属性数据入库流程图

㈡ 图片数据库怎么建立

在建立数据库是应该想好各个数据之间的关系,需要存储哪些数据,这些数据直接是一对一,一对多还是多对
一得
关系。一般保存图片数据的话不建议直接保存图片,而建议保存图片的地址,大致需要这回么几个字段,
主键
,图片的
绝对地址
,图片答的大小,图片的名称等等

㈢ 图像控制点库的建立及应用方法探讨

曾福年 赵翠玲

(中国国土资源航空物探遥感中心,北京,100083)

摘要:本文探讨了建立SPOT5图像控制点数据库的原理和方法,介绍了如何建立适合于SPOT5校正的控制点数据库,并提取控制点与待纠正影像进行自动或人工干预匹配,寻找预正射影像上的同名点建立控制点对,实现对影像的几何纠正。

关键词:SPOT5图像;控制点数据库;匹配;几何纠正

1 引言

SPOT5图像的正射纠正是土地动态监测项目中图像处理的一个基本过程,无论是物理模型方程法还是多项式纠正法,都需要利用地面控制点来解算转换矩阵以实现几何纠正。目前,土地动态监测项目已经开始建立许多的图像控制点,包括正射纠正后的航空或高分辨遥感数字图像控制点、扫描纠正后的大比例数字地形图上图形控制点和新测的野外GPS图像控制点。但这些控制点要有效地利用起来,其关键是有效地管理这些控制点。这些控制点应该在使用后被存储,再次使用时可以重新调用和更新。因此,建立控制点数据库以实现控制点的有效利用就非常必要了。由于图像控制点的特殊性,本文就图像控制点数据库的建立和使用方法进行阐述。

图像控制点就是包含具有地理位置信息的一个地物的图像,其存储格式是带地理信息的栅格形式。图像控制点是利用影像之间的匹配来寻找预正射影像上的同名点,从而可以避免传统控制点的标志在预正射影像上不易于识别的困难。在计算机软硬件和模式识别技术的支持下,利用图像控制点来代替传统的控制点进行几何纠正,可以大大减轻劳动强度和提高作业效率与纠正精度。

2 图像控制点库建立

图像控制点数据库的根本目的是用来对控制点进行有效的管理并方便地提取控制点来实现图像的几何纠正。这要求数据库的设计应围绕着控制点的使用来进行。在进行SPOT5几何纠正时,待纠正影像的概略空间范围是根据SPOT5 的轨道参数已知的,控制点就是按照这个范围来提取的。控制点数据库首先实现以空间范围为基础的控制点查询是控制点数据库的最基本功能,同时,每一个图像控制点都包含两种数据,图像数据和属性数据,这两种数据的连接是应用控制点数据库的重要依据。应用控制点数据库应使用带有自动位置预测的遥感软件。图像控制点数据库的设计就是根据这三个基本原则来进行的。

2.1 图像控制点来源

图像控制点是以图像为基础,以矢量为辅的文件。

(1)把正射纠正后的航空或遥感数字图像上裁剪下来的典型区域的一小块范围的图像作为图像控制点。

(2)根据野外GPS控制点坐标,在原始图像上标注控制点的位置,并附带有原数据说明文档和实地数码相片。

(3)从扫描纠正后的数字地形图上得到的典型地物区域的一小块范围的数字图像作为图像控制点。

(4)图像控制点参考坐标系统应与要求的成果图像的坐标系统一致。

2.2 基础控制点库的内容

控制点库是管理图像控制点的,图像控制点包含两种数据:图像数据和属性数据。无论采用何种方式采集的图像控制点,都同时具有这两种数据。图像数据和属性数据分开存放在不同的库体之中,图像数据的存储格式是栅格形式,而且属性数据的存储格式是矢量形式。图像数据和属性数据必须建立存放在不同的库体之中的连接。

2.2.1 图像数据

图像控制点是以栅格形式存储的包含某一个明显地物的图像。在数据库中,由于栅格图像的特殊性,它无法像属性数据以一条记录来存储,每一个图像都是以栅格文件存储在一定的目录下,按目录来进行管理。图像的大小一般在100×100像素和200×200像素之间,以能包含一明显地物为准。图像控制点区别于传统的控制点就在于它有图像数据。图像中的明显地物是指在一定的范围内可以区别于周围其他地物的,可以是一个道路的交叉口,也可以是一个小河流的拐弯处,甚至可以是一个小岛。它的特点使得它在传统的控制点无法确定的区域能够选点进行几何纠正。

2.2.2 属性数据

属性数据是用来描述控制点的地理位置等关系的。一组图像要当作控制点来进行几何纠正,它们必须具有在某一确定的投影空间的正确的相互位置关系。图像控制点的地理位置就是由它们的属性数据来描述的,为了正确描述地理位置关系,每一个控制点的属性数据要具有和影像数据进行联结的一致ID标识号,以实现图像数据与属性数据的正确连接。所有控制点的属性数据格式是相同的,因此属性数据库是关系数据库,每一个图像控制点的属性以规定的格式记录。属性数据记录包括:图像控制点来源;控制点坐标;数据说明;参考椭球;影像的比例尺;超级连接的野外GPS控制点数码相片。

2.2.3 坐标系统

所有的图像控制点都是投影到一定的参考坐标系统里的。为了提高数据库的使用性能,正确表示控制点在整个数据库范围内的相互地理位置关系,控制点应该采用统一的坐标系统,以利于控制点的正确查询提取与使用。

2.3 控制点库的结构

不同地区的控制点数目不同,大范围地区的控制点数据量非常大。大范围地区单一的一个数据库对于控制点的查询使用是非常不便的,会降低数据库的性能,因此为了快速方便地查询提取控制点,就要以索引的方式来层层建库,形成一个树形结构的控制点库体。由于控制点是按空间的地理位置来分布的,因此按地理位置范围来将一个大的区域分为几个小的区域是合理的,而且可以根据实际的情况来对小的区域进行进一步的细分,由此从上到下建立一级一级的索引数据库。

顶级数据库是全局数据库,它描述的是整个建库范围内的分区数据库的信息,也是关系数据库。它的记录描述的内容是:子数据库的名称,子数据库所包含的范围信息等。根据实际的情况,子数据库中描述的可以是再下一级的数据库的信息,也可以是控制点的信息。

图1 树形数据库结构

在这个树形的数据库结构中,叶子数据库处在最基础位置,描述的是图像控制点的信息。当要从数据库中提取控制点时,就可以从顶端的数据库一层一层地向下查询,直至叶子数据库查询基础控制点库的内容,见图1。

从结构图看出,由于图像和属性数据是以文件存放在某一确定的目录中,图像数据库的管理实际就是对文件目录的管理。合理的组织文件目录才能够实现图像数据与属性数据的连接,这就要求目录的结构与命名和属性数据库要一致。

3 控制点库的应用

图像控制点库的目的就是有效地组织管理控制点,方便地提取某一影像范围内的控制点来进行几何纠正。一景待纠正的SPOT5 影像,由于原始数据轨道参数的导入,可以得到它的一个带有地理信息的影像。根据这个地理信息范围,从最上一级的控制点数据库开始,找到这一影像所在范围的子数据库,再进入下一级数据库,进行同样的判断,直至最底层的数据库,就可以提取出位于这一影像范围内的图像控制点,进行几何纠正。

一个控制点一旦被提取出来,就可以获取它的地理位置数据,根据它的位置和待纠正遥感影像的地理信息,可以自动匹配控制点在影像上的大致位置范围,在这一范围内进行搜索,可以大大缩小同名点匹配的搜索过程,提高匹配的速度和精度。

在使用控制点时,不管 GPS 控制点还是图像控制点,简单的方法是在待纠正的影像上标识出控制点的大致范围,这可以仅根据控制点的地理坐标和影像的范围来获取,然后用鼠标在计算机屏幕上通过点击来获取控制点的同名点的影像像素坐标。要实现几何纠正的自动化,就要利用影像的匹配技术来进行控制点与待纠正影像上的同名点的自动匹配。根据控制点的种类的不同,采取不同的匹配技术来进行。控制点数据库中应用过程参见图2。

图2 控制值数据库应用过程

3.1 遥感数字图像控制点配准方法

对正射纠正后的航空或遥感数字图像上裁剪下来的典型区域的一小块范围的图像作为图像控制点采用基于区域特征的和基于点特征的配准方法。

3.1.1 基于区域的配准方法

基于区域的配准方法是将待配准图像中一块区域与参考图像中的相同尺寸的区域从统计学上进行比较,其相似度评测标准是从两块区域的标准化交叉相关系数中取最大值者。也可以通过FFT变换将图像由时域变换到频域,然后再进行配准。对位移量比较大的图像,可以先校正图像的旋转,然后建立两幅图像之间的映射关系。但如果图像中存在比较大的噪声和灰度差异时,这个交叉相关测量标准就变得不可靠。

3.1.2 基于点特征的配准方法

基于点特征的配准方法有较高的性能。它有两个过程:特征抽取和特征配准,一系列的图像分割技术都被用到特征的抽取和边界检测上。如Canny算子、拉普拉斯高斯算子、区域生长算子。抽取出来的空间特征有闭合的边界、开边界、交叉线以及其他特征。特征匹配的算法有:交叉相关、距离变换、动态编程、结构匹配等算法。

3.2 GPS 控制点配准方法

对野外GPS控制点在原始图像上标注控制点的位置和扫描纠正后的数字地形图上得到的典型地物区域的一小块范围的数字图像作为控制点采用人工匹配同名点的方法。

由于地形图控制点所提供的仅是地物的一个结构信息,类似于影像的纹理。它不反映地物的光谱信息,与待纠正影像上的内容不一致;它不能利用控制点片中的数据直接来进行影像匹配。因此,只能利用这一个结构信息采用人工匹配同名点的方法,在可以自动预测控制点在影像上的大致位置范围内,根据影像的纹理特征寻找控制点的同名点。

综合上述方法,在对足够数目的控制点进行匹配找到同名点后,就可以根据这些控制点解算转换矩阵实现几何纠正。

图像控制点库的建立是一项基础的工作,大量的数据要输入数据库。一旦数据库建立起来,可以利用最新的遥感数据进行更新,当需要利用控制点对新的遥感数据进行几何纠正时,可以方便快捷地提取控制点,提高工作效率,为土地调查工作提供技术保障。

参考文献

Barbara Zitová and Jan Flusser.“Image registration methods:a survey.”Imaging and VisionComputing,vol.21,pp.977~1000,2003

张祖勋,张剑清.数字摄影测量学.武汉:武汉测绘科技大学出版社,1996

张祖勋、张剑清.山区遥感(RS)影像的小面元微分纠正.第三届海峡两岸测绘发展研讨会论文集,2000,12

陈跃峰,肖自美.基于内容查询的图像数据库系统模型[J].中国图像图形学报,1997

㈣ 高分辨率影像数据处理及数据建库技术方法研究

潘振祥

(河南省国土资源厅信息中心 郑州 450016)

摘 要:本文通过开展高分辨率卫星遥感影像数据(SPOT5)处理及建库技术方法研究和探索,制定了《高分辨率影像数据处理及基于遥感影像土地利用数据库建设技术要求》和《省级基于遥感影像 1∶1 万土地利用数据库标准》,制作了覆盖河南全省的 1∶1 万数字正射影像图,建立了河南省基于 SPOT 5 的 GPS 像控点图形图像数据库、高分辨率卫星影像数据库和基于影像信息土地利用数据库,为全国土地利用二次调查基础底图制作进行了有益的探索。

关键词:土地资源 卫星影像 遥感 数据库 像控点

0 引 言

随着信息技术的快速发展,卫星遥感影像处理技术得到了突破性进展,高分辨率卫星影像在土地资源调查评价、土地利用动态遥感监测、土地执法监察、土地变更调查以及大中比例尺地形图测绘等方面应用已取得显着成效。

针对河南省高分辨率遥感影像数据处理及数据库建设项目任务,项目组提出了利用 GPS 外业静态实测坐标作为影像数据校正的控制资料,制定了《高分辨率影像数据处理及基于遥感影像土地利用数据库建设技术要求》和《省级基于遥感影像 1∶1 万土地利用数据库标准》等,并根据项目任务要求,制定了切合河南实际的基于遥感影像信息的土地利用分类体系,同时,通过项目开展,制作了覆盖河南全省的 SPOT 5 数字正射影像图(DOM),并建立了河南省基于 SPOT 5的 GPS 像控点图形图像数据库,为土地利用二次调查基础底图制作进行了有益的探索。

1 影像数据处理及数据库建设技术路线

(1)多源遥感信息相结合。选取最佳波段组合的多光谱影像与高分辨率全色影像融合,生产具有高分辨率空间信息和丰富光谱信息的融合影像。

(2)GPS 像控点、基础图件(数据库)和 DEM 相结合。根据实际情况,采用 GPS 像控点,同时利用 1∶5 万 DEM 对遥感影像进行正射校正。

(3)人机交互与计算机自动提取相结合。以人机交互解译为主,进行土地分类信息提取。

(4)遥感解译与地面调查相结合。对提取的地类图斑信息进行外业验证,对在室内不确定的地类图斑,进行外业实地调查。

2 GPS 像控点图形图像数据库建立

为保证像控点选取精度,首先在 2.5 m 分辨率的全色影像上,按照像控点选取的技术要求,每景均匀选取了 25 个像控点,并对像控点进行了全外业 GPS 静态测量,在 MapGIS 平台下编辑像控点属性结构,建立 GPS 像控点图形图像数据库,并将像控点外业测量成果表以图片方式保存在属性表中。如图1所示。

图1 像控点图形图像数据库示意图

2.1 GPS 像控点选取

为保证像控点外业测量精度,像控点选取时,点位分布要相对均匀,特征明显,交通便利,数量足够,尽可能在全色影像上选取,尽量避开高压线、大面积水域等干扰因素。

为提高外业测量效率,将选取的待测像控点制作成“像控点外业测量成果表”,成果表包括像控点编号、点位及放大的示意图、WGS84、1954 北京、1980 年西安三套坐标和点位说明等内容。

2.2 GPS 像控点外业施测

像控点外业测量采用附合路线法,各像控点平均间距约 13 km,像控点与 C 级 GPS 控制点组成 GPS 控制网。GPS 像控点外业测量利用河南省 C 级 GPS 控制网成果的三套数据(分别为WGS 84、1954 北京和 1980 年西安坐标)作为起算数据,依据《全球定位系统(GPS)测量规范》,采用静态方式同步进行观测,三台套 GPS 接收机为一组,观测时段长度不少于 45 分钟,卫星高度角≥ 15°,有效观测卫星总数≥ 4 个。测量数据采用南方测绘软件进行基线解算、平差处理并进行高程拟合,最后解算出像控点基于三套坐标系统的三套数据和拟合高程。

2.3 GPS 像控点图形图像数据库的建立

GPS 像控点图形图像数据库以河南省 1∶50 万地理底图作为工作底图,输入像控点空间坐标,并采集像控点属性与图形信息,建立数学基准统一的像控点图形图像文件。像控点图形图像信息,除像控点所具有的地理坐标信息之外,还包括与待纠正影像相关的特征地物的纹理信息、分辨率信息等。

3 影像数据处理

影像数据处理包括卫星影像全色数据与多光谱数据的配准、融合和影像数据正射校正、镶嵌及正射影像图(DOM)的制作等。本项目所使用到的 SPOT 5 数据是由视宝公司提供的 1A 级数据,只经过了探测器的均衡化处理,为了进行多元数据的复合,制作正射影像图,必须对图像进行正射校正,建立地理坐标。影像数据处理技术流程如图 2 所示。

图2 影像数据处理技术流程

3.1 影像配准

本项目使用的单景多光谱数据与全色数据是同步接收到的,其图形的几何相关性较好,多光谱数据与全色配准难度小、精度高,因此采用相对配准的方法,SPOT 5 多光谱数据波段组合采用 XS2(红)、XS3(绿)、XS1(蓝)形式,影像重采样间隔为 2.5 m,重采样方法采用双线性内插,以景为配准单元,以 SPOT 5 全色数据为配准基础,均匀选取配准控制点,对接收侧视角较大,地势起伏对配准影响较为严重的区域相应增加控制点密度,将 SPOT 5 多光谱数据与之精确配准,并随机选择配准后全色与多光谱数据上的同名点进行检查,以确保数据的配准精度。

3.2 影像融合

图像融合处理采用最基本的乘积组合算法直接对两种空间分辨率的遥感数据进行合成,融合后图像则采用直方图调整、USM 锐化、彩色平衡、色度饱和度调整和反差增强等手段,以使整景影像色彩均匀、明暗程度适中、清晰,增强专题信息,特别是加强纹理信息。

3.3 影像正射校正

影像正射校正采用 ERDAS 的 LPS 正射模块,利用 SPOT 5 物理模型,每景 25 个像控点均匀分布于整景影像,各相邻景影像重叠区有 2 个以上共用点。正射校正以实测点和 1∶5 万 DEM为校正基础,以景为单元,对融合后的数据进行正射校正,采样间隔为 2.5 m。

3.4 影像镶嵌

影像镶嵌采用 ERDAS 的 LPS 正射模块中批量处理模块,相邻两幅影像,均采集了两个以上共用点,大大提高了影像镶嵌精度。为验证镶嵌精度,以县(市、区)为单位,在其镶嵌区随机选择 25 个以上检查点进行镶嵌精度检查。

3.5 数字正射影像图制作

数字正射影像图(DOM)制作采用 Image Info 工具,按照 1∶1 万标准分幅进行裁切,覆盖完整的县级行政辖区。图幅整饰依据《高分辨率影像数据处理及数据库建设技术要求》,利用MapGIS 数据库平台,按照 1954 北京坐标系、1985 年国家高程基准的生成 1∶1 万标准分幅图幅整饰。

4 创新成果

项目组在圆满完成项目任务的前提下,结合项目进展和土地管理需要,创造性地开展工作。总结项目进展和取得的成果,创新成果主要体现在:

(1)影像校正控制点 GPS 外业实测数据作为影像校正控制资料,改变了以往利用地形图、土地利用现状图(数据库)作为控制资料的传统方式,极大地提高了影像校正精度,节省了项目投入经费。

覆盖河南全省 1∶1 万标准分幅地形图共计 6565 幅,而实有地形图仅 5600 余幅,项目组在征求部课题组同意的前提下,提出采用 GPS 外业实测控制点作为影像校正控制资料的思路。基于这一思路,项目组进行了一系列研究和论证,制定了 GPS 外业测量技术要求,并对覆盖全省的每景 SPOT 5 卫星影像相对均匀地选取了 25 个控制点,相邻景影像不少于 2 个共用控制点的原则,全省共选取影像校正控制点 1421 个,GPS 大地控制 C 级点 94 个。根据影像数据接收时间和项目进度,共分 13 个测区,对所有控制点采用附和路线法进行了静态测量,分别计算出各控制点和检查点的 WGS84、1954 北京和 1980 年西安三套坐标。

(2)河南省像控点图形图像数据库的建立,为今后河南全省土地利用遥感监测、卫片执法监察等提供了技术保障。

为使外业测量成果长期保存和今后使用,项目组在项目任务之外,在 MapGIS 平台上,基于河南省 1∶50 万地理底图,建立了 GPS 像控点图形图像数据库。GPS 像控点图形图像数据库的建立,不仅满足 SPOT 5_2.5 m 高分辨率卫星影像的校正精度要求,同时为今后河南全省土地利用遥感监测、卫片执法检查、矿山环境监测等奠定了基础。

(3)高分辨率影像数据大区域整体正射校正和镶嵌处理技术的探索,为影像数据批处理技术的推广进行了有益的探索。

由于本次试点项目涉及的范围广、影像处理工作量大,因此,项目组在保证影像纠正精度的前提下,为提高工作效率,探索和使用了遥感影像专业处理软件 ERDAS 的 LPS 模块提供的大区域整体正射纠正和影像镶嵌处理功能,达到了较好的应用效果。

鉴于本次试点项目所使用的影像数据均为同步接收的 SPOT 5 多光谱与全色数据,其图形的几何相关性较好,多光谱数据与全色配准难度小、精度高,因此,影像数据处理采用先单景融合、后大区域整体正射校正、最后进行大区域镶嵌配准的技术流程进行影像处理。

正射纠正采用 ERDAS 的 LPS 批量正射模块。纠正采用 SPOT 5 物理模型,控制点均匀分布于整景影像,每景控制点个数为 25 个,各相邻影像重叠区有 2 个以上共用点。正射纠正以 GPS外业实测控制点和预处理的河南省 1∶5 万 DEM 为纠正基础 , 对 SPOT 5 融合数据进行批量纠正,采样间隔为 2.5 m。影像镶嵌采用的是 ERDAS 的 LPS 批处理模块,由于各相邻景影像均采集了两个以上的共用点,大大提高了影像镶嵌精度。

(4)基于遥感影像信息土地利用分类标准体系的制定,为国家和省级快速掌握和提取土地利用变化信息进行了有益的探索。

项目组根据部课题组要求及国家和省土地管理工作需要,结合 SPOT 5 卫星影像光谱特征和纹理信息,经充分研究和论证,制定了切合河南实际、满足“高分辨率影像数据处理及数据库建设”试点项目需要的基于遥感影像信息的土地利用分类标准,该标准中将土地利用类型分为农用地、建设用地和未利用地等 3 个大类,耕地、园林地、其他农用地、城市用地、建制镇用地、农村居民点用地、铁路用地、公路用地、其他建设用地、未利用地等 10 个二级类,此外,根据个别地类特点,又分别从农用地、建设用地和未利用地中单独划分出公路林带、农业水利用地、水利设施用地、未利用水面和黄河滩地等 5 个三级类,分类标准与现有的土地利用分类体系协调、一致,符合国土资源土地分类标准体系。

(5)基于遥感影像土地利用数据库建设,为国家和省土地宏观管理提供了现势性较强的土地利用电子数据,为国内同类工作的开展提供了技术依据。

考虑到国家和省级土地宏观管理的需要,根据项目制定的“基于遥感影像土地利用分类体系”,结合中地公司 MapGIS 土地利用数据库管理系统框架结构,项目组在 MapGIS 数据库管理系统平台的基础上,分别制定了《高分辨率影像数据处理及数据库建设技术要求》和《基于遥感影像 1∶1 万土地利用数据库标准》等,并在标准中明确了基于遥感影像的土地分类、文件命名规则、数据分层格式及要求等,保证了数据标准和数据格式的一致性及数据库建设质量,为国家和省提供了翔实的土地利用现势数据。

5 结 语

随着遥感技术和计算机技术的飞速发展,高分辨率遥感影像数据在土地管理工作中的应用越来越普遍,同时,遥感影像数据处理的技术手段也越来越科学、越来越先进,尤其是全国第二次土地调查工作的全面开展,将遥感影像在土地管理方面的应用推到一个前所未有的水平,因此,如何在影像数据处理过程中尽可能减少人力和财力投入已显得尤为重要。本项目针对上述问题,在科研与生产过程中,提出的采用 GPS 外业实测控制点作为影像校正控制资料、GPS 像控点图形图像数据建库及基于国家和省级土地管理需要而提出的基于遥感影像信息土地利用数据库标准等,进行了较好的诠释,为今后同类工作的开展进行了有益的探索。

参 考 文 献

常庆瑞,等.2004.遥感技术导论[M]. 北京:科学出版社

陈述彭,等.1998.遥感信息机理研究[M].北京:科学出版社

党安荣,等.2003.ERDAS IMAGING 遥感图像处理方法[M].北京:清华大学出版社

汤国安,等.2004.遥感数字影像处理[M]. 北京:科学出版社

徐柏清.1988.正射投影技术与影像地图[M].北京:测绘出版社

尤淑撑,刘顺喜.2002.GPS 在土地变更调查中的应用研究[J].测绘通报(5):1~3

张继贤,等.2000.图形图像控制点库及应用[J].测绘通报(1)

(原载《测绘通报》2008 年第 10 期)

㈤ 如何建立图像数据库

建立,SQLSERVER实现
CREATE TABLE dbo.服装图片 (
id int IDENTITY (1, 1) NOT NULL ,
标题 varchar (50) ,
说明 text ,
存放路径 varchar (50),
图片尺寸 varchar (50),
其它属性 varchar (50)
)
操作:
前台语言编写,可按标题等属性查询图片,或通过GRID控件显示列表,通过调入的存放路径和文件名字串调入到图片控件显示图片。

㈥ 教你轻松掌握数据仓库的规划和构建策略

教你轻松掌握数据仓库的规划和构建策略

数据仓库作为决策支持系统(DSS)的基础,具有面向主题的、集成的、不可更新的、随时间不断变化的特性。这些特点说明了数据仓库从数据组织到数据处理,都与原来的数据库有很大的区别,这也就需要在数据仓库系统设计时寻求一个适合于数据仓库设计的方法。在一般的系统开发规划中,首先需要确定系统的功能,这些系统的功能一般是通过对用户的需求分析得到的。从数据仓库的应用角度来看,DSS分析员一般是企业中的中高层管理人员,他们对决策支持的需求不能预先做出规范的说明,只能给设计人员一个抽象地描述。
这就需要设计人员在与用户不断的交流沟通中,将系统的需求逐步明确,并加以完善。因此数据仓库的开发规划过程实际上是一个用户和设计人员对其不断了解、熟悉和完善的过程。 数据仓库的开发应用规划是开发数据仓库的首要任务。只有制定了正确的数据仓库规划,才能使组织主要力量有序地实现数据仓库的开发应用。在数据仓库规划中一般需要经历这样几个过程:选择实现策略、确定数据仓库的开发目标和实现范围、选择数据仓库体系结构、建立商业和项目规划预算。 当数据仓库规划完成后,需要编制相应的数据仓库规划说明书,说明数据仓库与企业战略的关系,以及与企业急需处理的、范围相对有限的开发机会,重点支持的职能部门和今后数据仓库开发工作的建议,实际使用方案和开发预算,作为数据仓库实际开发的依据。
1、选择数据仓库实现策略
数据仓库的开发策略主要有自顶向下、自底向上和这两种策略的联合使用。自顶向下策略在实际应用中比较困难,因为数据仓库的功能是一种决策支持功能。这种功能在企业战略的应用范围中常常是很难确定的,因为数据仓库的应用机会往往超出企业当前的实际业务范围,而且在开发前就确定目标,会在实现预定目标后就不再追求新的应用,是数据仓库丧失更有战略意义的应用。由于该策略在开发前就可以给出数据仓库的实现范围,能够清楚地向决策者和企业描述系统的收益情况和实现目标,因此是一种有效的数据仓库开发策略。该方法使用时需要开发人员具有丰富的自顶向下开发系统的经验,企业决策层和管理人员完全知道数据仓库的预定目标并且了解数据仓库能够在那些决策中发挥作用。
自底向上策略一般从某个数据仓库原型开始,选择一些特定的为企业管理人员所熟知的管理问题作为数据仓库开发的对象,在此基础上进行数据仓库的开发。因此,该策略常常用于一个数据集市、一个经理系统或一个部门的数据仓库开发。该策略的优点在于企业能够以较小的投入,获得较高的数据仓库应用收益。在开发过程中,人员投入较少,也容易获得成效。当然,如果某个项目的开发失败可能造成企业整个数据仓库系统开发的延迟。该策略一般用于企业洗碗对数据仓库的技术进行评价,以确定该技术的应用方式、地点和时间,或希望了解实现和运行数据仓库所需要的各种费用,或在数据仓库的应用目标并不是很明确时,数据仓库对决策过程影响不是很明确时使用。
在自顶向下的开发策略中可以采用结构化或面向对象的方法,按照数据仓库的规划、需求确定、系统分析、系统设计、系统集成、系统测试和系统试运行的阶段完成数据仓库的开发。而在自底向上的开发中,则可以采用螺旋式的原型开发方法,使用户可以根据新的需求对试运行的系统进行修改。螺旋式的原型开发方法要求在较短的时间内快速的生成可以不断增加功能的数据仓库系统,这种开发方法主要适合于这样一些场合:在企业的市场动向和需求无法预测,市场的时机是实现产品的重要组成部分,不断地改进对与企业的市场调节是必需的;持久的竞争优势来自连续不断地改进,系统地改进是基于用户在使用中的不断发现。 自顶向下和自底向上策略的联合使用具有两种策略的优点,既能快速的完成数据仓库的开发与应用,还可建立具有长远价值的数据仓库方案。但在实践中往往难以操作,通常需要能够建立、应用和维护企业模型、数据模型和技术结构的、具有丰富经验的开发人员,能够熟练的从具体(如业务系统中的元数据)转移到抽象(只基于业务性质而不是基于实现系统技术的逻辑模型);企业需要拥有由最终用户和信息系统人员组成的有经验的开发小组,能够清楚地指出数据仓库在企业战略决策支持中的应用。
2、确定数据仓库的开发目标和实现范围
为确定数据仓库的开发目标和实现范围,首先需要对企业管理者等数据仓库用户解释数据仓库在企业管理中的应用和发展趋势,说明企业组织和使用数据来支持跨功能系统的重要性,对企业经营战略的支持,以确定开发目标。在该阶段确认与使用数据仓库有关的业务要求,这些要求应该只支持最主要的业务职能部门,将使用精力集中在收益明显的业务上,使数据仓库的应用立即产生效果,不应该消耗太多的精力在各个业务上同时铺开数据仓库的应用。
在确定开发目标和范围以后,应该编制需求文档,作为今后开发数据仓库的依据。 数据仓库开发的首要目标是确定所需要信息的范围,确定用户提供决策帮助时,在主题和指标域需要哪些数据源。这就需要定义:用户需要什么数据?面向主题的数据仓库需要什么样的支持数据?为成功地向用户提交数据,开发人员需要哪些商业知识?哪些背景知识?这就需要定义整体需求,以文件的形式整理现存的记录系统和系统环境,对使用数据仓库中数据的候选应用系统进行标识、排序,构造一个传递模型,确定尺度、事实及时间标记算法,以便从系统中抽取信息且将他们放入数据仓库。通过信息范围确定可为开发人员提供一个良好的分析平台,和用户一起分析哪些信息是数据仓库需要的,进行商业活动需要什么数据。开发人员可以和用户进一步定义需要,例如数据分级层次、聚合的层次、加载的频率以及需要保持的时间表等。 数据仓库开发的另一个重要目标是确定利用哪些方法和工具访问和导航数据?虽然用户都需要存取并且检索数据仓库的内容,但是所存取的粒度有所不同,有的可能是详细的记录,有的可能是比较概括的记录或十分概括的记录。用户要求的数据概括程度不同,将导致数据仓库的聚集和概括工具的需求不同。
数据仓库还有具有一定功能来访问和检索图表、预定义的报表、多维数据、概括性数据和详细记录。用户从数据仓库中获得信息,应该有电子表格、统计分析器和支持多维分析的分析处理器等工具的支持,以解释和分析数据仓库中的内容,产生并且验证不同的市场假设、建议和决策方案。为将决策建议和各种决策方案向用户清楚地表达出来,需要利用报表、图表和图像等强有力的信息表达工具。 数据仓库开发的其他目标,是确定数据仓库内部数据的规模。在数据仓库中不仅包含当前数据,而且包含多年的历史数据。数据的概括程度决定了这些数据压缩和概括的最大限度。如果要让数据仓库提供对历史记录进行决策查询的功能,就必须支持对大量数据的管理。数据的规模不仅直接影响决策查询的时间,而且还将直接影响企业决策的质量。
在数据仓库的开发目标中,还有:根据用户对数据仓库的基本需求,确定数据仓库中数据的含义;确定数据仓库内容的质量,以确定使用、分析和建议的可信级别;哪种类型的数据仓库可以满足最终用户的需求,这些数据仓库应该具有怎样的功能;需要哪些元数据,如何使用数据源中的数据等。 数据仓库的开发目标多种多样,十分复杂,需要开发人员和用户在开发与使用的过程中不断交互完善。因此,在规划中需要确定数据仓库的开发范围。使开发人员能够根据需求和目标的重要性逐步进行,并且在开发中吸取经验教训,为数据仓库在企业中的全部实现提供技术准备。因此,在为数据仓库确定总体开发方向和目标以后,就必须确定一个有限的能够很快体现数据仓库效益的使用范围。在考虑数据仓库苦的应用范围时,主要从使用部门的数量和类型、数据源的数量、企业模型的子集、预算分配以及开发项目所需的时间等角度分析。
在分析这些因素时,可从用户的角度和技术的角度两方面进行。 从用户的角度应该分析哪些部门最先使用数据仓库?是哪些人员为了什么目的使用数据仓库?以及数据仓库首先要满足哪些决策查询?因为这些决策查询往往确定了关于数据维数、报表的种类,这些因素都将确定数据仓库定义时所需要的数量关系。查询的格式越具体,越容易提供数据仓库的维数、聚集和概括的规划说明。 从技术角度分析,应该确定数据仓库中元数据库的规模,数据仓库的元数据库是存储数据仓库中数据定义的模型。数据定义存储在仓库管理器的目录中,可以作为所有查询和报表工具构造和查询数据仓库的依据。元数据库的规模直接表示了数据仓库中必须管理的数据规模。通过对元数据库规模的管理,实际上就确定了数据仓库中所需要管理的数据规模。
3、数据仓库的结构选择
数据仓库的结构可以进行灵活的选择,可将组织所使用的各种平台进行恰当的分割,把数据源、数据仓库和最终用户使用的工作站分割开来进行恰当的设计。
(1)数据仓库的应用结构
基于业务处理系统的数据仓库 在这种结构中,将运作的数据用于无需修改数据的只读应用程序中。具有这种结构的数据仓库元数据库是一种虚库,而不是数据仓库自身的元数据。在数据仓库元数据库的直接指导下,对数据仓库的查询就是简单的从数据库中抽取数据。
单纯数据仓库
利用在数据仓库中的数据源净化、集成、概括和集成等操作,将数据源从业务处理系统中传输进集中的数据仓库,各部门的数据仓库应用只在数据仓库中进行。这种结构经常发生在多部门、少用户使用数据仓库的情况下。这里的集中仅仅是逻辑上的,物理上可能是分散的。
单纯数据集市
数据集市是指在部门中使用的数据仓库,因为企业中的各个职能部门都有自己的特殊需要,而统一的数据仓库可能不能满足这些部门的特殊要求。这种体系结构经常发生在个别部门对数据仓库的应用感兴趣,而组织中其他部门却对数据仓库的应用十分冷漠之时,由热心的部门单独开发式所采用。
数据仓库和数据集市
企业各部门拥有满足自己需要的数据集市,其数据从企业数据仓库中获取,而数据仓库从企业各种数据源中收集和分配。这种体系结构是一种较为完善的数据仓库体系结构,往往发生在组织整体对数据仓库应用感兴趣之时所采用的体系结构。
(2)数据仓库的技术平台结构 单层结构
单层结构主要是在数据源和数据仓库之间共享平台,或者让数据源、数据仓库、数据集市与最终用户工作站使用同一个平台。共享一个平台可以降低数据抽取和数据转换的复杂性,但是共享平台在应用中可能遇到性能和管理方面的问题,这种体系结构一般在数据仓库规模较小,而组织的业务系统平台具有较大潜力之时所采用。
客户/服务器两层结构
一层为客户机,一层为服务器,最终用户访问工具在客户层上运行,而数据源、数据仓库和数据集市位于服务器上,该技术机构一般用于普通规模的数据仓库。
三层客户/服务器结构
基于工作站的客户层、基于服务器的中间层和基于主机的第三层。主机层负责管理数据源和可选的源数据转换;服务器运行数据仓库和数据集市软件,并且存储仓库的数据;客户工作站运行查询和报表运用程序,且还可以存储从数据集市或数据仓库卸载的局部数据。在数据仓库稍具规模,两层数据仓库结构已经不能满足客户的需求,要讲数据仓库的数据存储管理、数据仓库的应用处理和客户端应用分开之时,可以采用这种结构。
多层式结构
这是在三层机构基础上发展起来的数据仓库结构,在该结构中从最内数据层到最外层的客户层依次是:单独的数据仓库存储层、对数据仓库和数据集市进行管理的数据仓库服务层、进行数据仓库查询处理的查询服务层、完成数据仓库应用处理的应用服务层和面向最终用户的客户层。体系层次可能多达五层,这种体系结构一般用于超规模数据仓库系统。
4、数据仓库使用方案和项目规划预算
数据仓库的实际使用方案与开发预算,是数据仓库规划中最后需要确定的问题。因为数据仓库主要用于对企业管理人员的决策支持,确保其实用性是十分重要的,因此需要让最终用户参与数据仓库的功能设计。这种参与是通过用户的实际使用方案进行的,使用方案是一个非常重要的需求模型。实际使用方案必须有助于阐明最终用户对数据仓库的要求,这些要求有的只使用适当的数据源就可以得到基本满足,而有的却需要来自企业外部的数据源,这就需要通过使用方案将这些不同的要求联系起来。 实际使用方案还可以将最终用户的决策支持要求与数据仓库的技术要求联系起来。因为当用户确定最终要求后,为元数据库的范围确定一个界限。还可以确定所需要的历史信息的数量,当根据特定的用户进行数据仓库的规划时,就可确定最终用户所关心的维度(时间、方位、商业单位和生产企业),因为维度与所需要的概括操作有明显的关系,必须选择对最终用户有实际意义的维度,如:“月”、“季度”、“年”等。最后,还可以确定数据集市/数据仓库的结构需要,使设计人员确定采用单纯数据仓库结构,还是单纯的数据集市结构或者是两者相结合的结构。
在实际使用开发方案确定后,还需要对开发方案的预算进行估计,确定项目的投资数额。投资方案的确定可以依据以往的软件开发成本,但是这种预算的评估比较粗糙。另一种方法是参照结构进行成本评估,也就是说,将数据仓库实际使用方案所确定的构件进行分解,根据各个构件的成本进行预算估算。数据仓库的构件包含在数据源、数据仓库、数据集市、最终用户存取、数据管理、元数据管理、传输基础等部分中,这些构件有的在企业原有信息系统中已经具备,有的可以选择商品化构件,有的则需要自我开发。根据这些构件的不同来源,可以确定比较准确的预算。 在完成数据仓库规划后,就需要编制数据仓库开发说明书,说明系统与企业战略目标的关系,以及系统与企业急需处理的范围相对有限的开发机会,所设想的业务机会的说明以及目标任务概况说明、重点支持的职能部门和今后工作的建议。数据仓库项目应有明确的业务价值计划开始,在计划中需要阐明期望取得的有形和无形的利益。无形利益包含利用数据仓库使决策完成得更快更好等利益。
业务价值计划最好由目标业务主管来完成,因为数据仓库是用户驱动的,应该让用户积极参与数据仓库的建设,在规划书中要确定数据仓库开发目标的实现范围、体系结构和使用方案及开发预算。

㈦ 图像数据库的简介

图像数据库是遥感图像的数据集合。遥感图像包含多谱段组成的图像数据,数据量庞大。图像数据是图像像元灰度值的记录,以行列数据矩阵表示。图像数据库由两个层次数据集合构成。第一层次为图像数据词典。数据内容包括对图像总体特征的描述,如波段、行数、列数、精度、记录格式、最大值、最小值、成像日期等;第二层次为图像基础数据,根据第一层次数据内容所提供的有关信息,可直接进入基础数据集合,进行检索、处理操作。

㈧ 省域控制点图形图像数据库的构建

管相荣

(河南省国土资源厅信息中心 郑州 450016)

摘 要:为了满足大区域控制点综合管理时针对多领域的需求,实现数据的共享所面临的坐标系统、属性结构、投影带、行政辖区、影像重叠区等问题,采用省域控制点图形图像数据库建立的案例分析,省域控制点图形图像数据库存储了控制点的属性、空间位置、图形图像等多项信息,叠合了行政辖区、原始影像、接合图表、投影带等信息,为第二次全国土地调查工作的开展提供了宝贵的资料和经验。

关键词:省域 控制点 GPS 控制点图形图像数据库

0 引 言

为确保“2010 年全国耕地面积不少于 18 亿亩(1.2 亿 hm2)的红线”,国家已经启动第二次全国土地调查,利用先进的技术和方法,力求建立“四级联动、上下互通”、“高保真”的土地利用数据库,实现土地管理的信息化、网络化。河南省作为全国人口和农业大省,土地总面积约16.7 万 km2,2007 年人均耕地面积 813.4 m2,低于全国平均水平,在国家严控耕地面积的严峻形势下,如何摸清土地家底、有效集约管理土地资源尤为重要。近年来,河南省运用先进的“3S”技术和通信技术,已经开展了多项土地资源监测、地籍调查方面的研究。全国高分辨率影像数据处理及数据库建设项目(以下简称“遥感项目”)是第二次全国土地调查的先导,旨在为其提供宝贵的经验。河南省作为项目试点之一,2005 年以 GPS 实测点为控制数据,影像数据均采用SPOT 5 遥感影像,对平顶山、许昌、漯河、安阳四个地市的遥感影像进行处理,精度满足要求。2007 年项目在全省铺开,布设控制点数达上千个,按照《SPOT 5_2.5 m 数字正射影像图制作技术规定》及《第二次全国土地调查底图生产技术规定》的要求,对影像处理必须精确,影像纠正控制点是土地信息提取的关键所在,如何综合管理这些控制点数据十分必要;同时,就我国 GPS控制网而言,GPS A B C 级点布设达上万个,而以此为基准的下一级 GPS 控制点将更多,对其进行分板机统筹管理也势在必行。

影像纠正控制点的获取途径有两种:一种是 GPS 实测,另一种是从大于等于调查底图比例尺的已有图件上采集。遥感项目河南试点控制数据均为 GPS 实测点,省域控制点管理包括 GPS 实测点和图形图像控制点,涉及跨省域、投影带、属性结构设定、编号、叠加分析、条件查询、图形查询、精度评定、点位分布联测略图等问题,有必要根据实际的工作底图情况,建立控制点图形图像数据库,实现控制点位置信息、属性信息、图形图像信息的统一管理,力图为同类研究提供参考。

1 控制点基础信息获取

1.1 控制点的布设与测量

项目控制点布设的工作底图是 SPOT 5_2.5 m 遥感影像,河南省域涉及 80 多景 SPOT 5 影像,受卫星数据获取周期的影响,影像是分批次提供的,为保证项目进度,控制点的布设采用先来先选的原则分批次进行。选取要求有:

(1)选取影像清晰、易于判别、交通便利的明显特征点,如影像特征明显的农村道路交叉路口,并读取概略经纬度;

(2)均匀分布,控制区域大于工作区范围,每景控制点数不少于 25 个,山区适当增加;

(3)边缘选点,相邻影像重叠区不少于 2 个同名公共点;

(4)模糊定位、圈定范围,为便于精确定位点的灵活性,采用 800 像素 ×800 像素的正方形选框,外业测量时可以在此选框内灵活定点,一般要求选框中间点位优先选用;

(5)内业选点难以测量时,可适当在该点附近重新选点,外业要作详细记录。

项目区覆盖多景影像,为的是选点均匀,公共点布局合理,在选取某景影像控制点时应同时参照相邻景,单景保证四角有点,其间三角形布点。控制点编号采用××××××_××××××_××,第一个“_”前为控制点所在景号,第一、第二个“_”之间为控制点所在影像的时相,共 6 位,采用年月日格式,第二个“_”后为控制点所在影像内序号,如 273280_061101_10, 表示景号为 273280、时相为 2006 年 11 月 1 日的影像上的第 10 个控制点,另外在测量成果表中增加测量编号和标准编号,测量编号是控制点布设实时编号,对应外业测量表中的序号,标准编号则按 1∶1 万标准图幅为基准,自上而下、自左而右的编号,如I49G030050, 以求更好地管理和应用控制点基础资料,为此我们设计了控制点测量成果表。

考虑到项目区山区、丘陵、平原均有分布,不同地形都选取检查点,在布点时类同控制点选取,只是在影像正射纠正时根据参与运算与否才设定其是控制点或是检查点。三种地形特征检查点可以从不同地形下分析控制点精度,对于布点较为困难的山区,可以打破单景的局限,采用区域布点检查法。

以国家 C 级 GPS 大地控制点为基准,采用静态方式同步进行观测,3 套 GPS 接收机为一组,观测时段长度为 45 min,卫星高度角≥ 15°,有效卫星总数≥ 4 个,作业员现场填写外业测量记录表,测队队员定时进行业内汇合,整个省域全部控制点测量耗时近 1 年,共完成 1454 个控制点的测量。

项目共布设 13 个测区,外业实地测量均采用环形布点形成一个整体的 GPS 控制网,各测区以不同的颜色表示,控制点间平均距离约 13 km,点位序号是项目区需要测量的纠正控制点测量编号,不足 4 位的前加“P”表示,前面加“C”的点则表示已有的 C 级 GPS 控制点。

1.2 控制点坐标及投影带的设置

控制点有 4 套坐标系统:西安 1980 坐标、北京 1954 坐标、WGS84 坐标、概略经纬度及高程。

项目采用高斯-克吕格投影 3 度分带、1985 国家高程基准、北京 1954 坐标系。河南省域跨越 37、38、39 带,测量的坐标数据存在 3 套数据,通常构建数据库时坐标系统的中央经线为114°,即 38 带。为确保整个省域建库数据为统一的坐标系统,就应把 37 带、39 带内的控制点进行换算,一般采用高斯投影、反算公式间接换带计算。现在把 37 带、39 带的控制点坐标换算成 38 带,见表 1。实测测量时,可通过仪器设置或基于坐标换带公式原理开发的专用软件换算。

表1 GPS 控制点 3 度分带相邻带坐标换算对应表(河南省)

续表

1.3 属性结构设定

为便于管理控制点图形图像数据库,并为后续国土研究提供基础资料,因此尽可能详述控制点的属性信息。表 2 是设定的控制点库表结构。

表2 控制点文件属性结构一览表

属性结构设定的特色:

(1)3 套编号系统(标准编号、景内编号、测量编号)。标准编号是所有 GPS 实测控制点选取完毕后,为便于管理,以 1∶1 万标准图幅为底图采用“自上而下、自左而右”原则重新编号,命名采用“1∶1 万标准图幅号 _ 图幅内序号”;景内编号则是就单景而言,景号 _ 时相 _ 景内序号命名;测量编号则是在项目实施中实际工作选点编号,作为控制点成果表整理及入库的依据。

(2) 4 套坐标数据(北京 1954 坐标、西安 1980 坐标、WGS84、概略经纬度)。概略经纬度可以对控制点在实地测量前进行模糊定位,此外也为了后期插叙的需要,例如,对一景现实性影像,通过幅宽经纬度可查询到其间大致所覆盖的控制点信息,减少了选点、测点等重复性工作。

(3)挂接点位影像、图形及实地信息。控制点影像库不仅有点的属性描述,也有点位图形和实测信息,使控制点信息更加丰富。

(4)与权属库、接合图表、影像范围图叠合,便于查看控制点的区域型分布、与影像及图幅间的关系。

1.4 与遥感影像的套合

控制点是遥感影像定位的基本参照信息,已知工作区的 DEM 和影像控制点坐标信息,就可以对影像进行几何纠正和投影差改正,制作数字正射影像图(DOM),提取土地利用现状信息,构建土地利用数据库,此亦第二次全国土地调查的前期业内工作。通常,我们是先在原始影像上布设控制点,测量其坐标信息,然后影像处理,即影像选取点、点定位影像的工作模式。但建立河南省控制点图形图像数据库后,对省域内任意工作区的影像,即没有投影和平面坐标信息的现时性影像,可以通过影像头文件找其所包含的控制点信息,避免了重复选点、测点。

控制点影像数据与遥感影像的套合、叠加查询分析,需要两者间存在恒定的某种信息。控制点是地球上的固定点,SPOT 5 遥感影像的头文件里显示影像获取时间及影像的经纬度坐标(大地坐标),为避免大地坐标与高斯平面坐标转换时的误差影响影像处理精度,目前只能通过两者的经纬度坐标,对影像包括的控制点信息进行模糊查询,然后再准确定位点。在 MapGIS 平台中,可以通过影像的经纬度坐标将其范围框直接定位到控制点图形图像数据库的平面坐标工程上,很直观地查看三者间的关系,如图 1 所示。

图1 控制点、影像、行政区空间关系图

2 控制点图形图像数据库构建

经过“布点、测点”后,在 ERDAS 软件的 LPS 模块里对控制点进行严格的精度检查,只有满足精度要求后才可入库,具体流程如图 2 所示。同时设定了数据库文件的组织(表 3)。基于上述数据库建设思路,在 MapGIS 平台上构建了控制点图形图像数据库,如图 3 所示。

图2 GPS 控制点图形图像数据库建库流程

图3 河南省 GPS 控制点图形图像数据库

表3 GPS 控制点图形图像数据库文件

3 结 论

控制点作为基础地理数据,其重要性不言而喻,河南省域共布设 1000 多个实测控制点,历时近 1 年,耗费了相当的人力物力,控制点图形图像数据库的建立旨在实现信息共享,避免资源浪费,为国土及其他领域的研究提供了宝贵的基础资料,尤其是在第二次全国土地调查河南工作区,控制点图形图像数据库对调查底图制作起到了十分重要的作用。另外,省域型控制点图形图像的建立也为大区域多数量控制点数据的综合管理提供了点滴参照。当然也有未涉及的内容,如不同等级控制点的管理、控制点的三维布局再现等。

参 考 文 献

GB/T 18314—200《1全球定位系统(GPS)测量规范》[S]

苏小霞,李英成.2006.全国多级多分辨率图形图像控制点数据库的建立与应用展望[J]. 遥感技术与应用,21(3):265~230

王之卓.1990.摄影测量原理(英文版)[M]. 武汉:武汉测绘科技大学出版社

曾福年,赵翠玲.2006.图像控制点库的建立及应用方法探讨[C].2006 年中国土地学会学术年会论文集

张继贤,马瑞金.2000.图形图像控制点库及应用[J]. 测绘通报(1):15~17

(原载《郑州大学学报(工学版)》2008 年第 2 期)