㈠ 基礎資料庫
(一)數據內容
基礎資料庫包括系統運行前所採集到的所有支撐數據,數據的具體內容在數據分類與數據源章節中已描述,概括可分為以下幾類。
(1)遙感影像數據:包括歷史圖像數據,以及按照一定監測周期更新的遙感圖像數據。
(2)數字線劃圖數據:矢量數據(現狀專題圖和歷史專題圖數據)、柵格數據、元數據等。入庫前數據以ArcInfoCoverage格式分幅或整體存儲,採用地理坐標系統。
(3)數字柵格圖數據:包括1∶5萬和1∶10萬基礎地理圖形數據的掃描柵格數據。
(4)數字高程模型數據:塔里木河幹流河道1∶1萬和「四源一干」區域1∶10萬數字高程模型。
(5)多媒體數據:考察照片、錄像、錄音和虛擬演示成果等多媒體資料。
(6)屬性數據:社會經濟與水資源數據、水利工程數據、生態環境數據等。
(二)數據存儲結構
1.柵格數據
柵格數據包括遙感影像、數字柵格圖、數字正射影像圖、數字高程模型等,這些數據的存儲結構基本類似,因此可進行統一設計。遙感圖像資料庫與普通的圖像資料庫在存儲上有些差別,遙感圖像作為感測器對地理、空間環境在不同條件下的測量結果(如光譜輻射特性、微波輻射特性),必須結合同時得到的幾個圖像才可以認為是對環境在一定的時間條件下的完整的描述,也即是說,可能需要一個圖像集合才能構成一個圖像的完整的概念,並使之與語義信息產生聯系(羅睿等,2000)。因此,遙感圖像數據存儲結構模型必須能夠描述幾個圖像(波段)之間的邏輯關系。利用ArcSDE進行數據入庫時,系統可自動建立各圖像(波段)之間的關系,並按一定規則存儲在資料庫系統中。
對柵格數據在後台將採用Oracle資料庫管理系統進行存儲。Oracle系統可直接存儲影像信息,並具有較強的數據管理能力,可以實現柵格數據信息的快速檢索和提取。數據引擎採用ArcSDE,實現各類影像數據的入庫。數據存儲的關鍵是建立圖幅索引,本系統數據的存儲按圖幅號、圖名、採集時間等內容建立索引。
柵格數據依據圖形屬性一體化的存儲思想,採用大二進制格式直接存儲數據,這種方式的存儲可實現內容的快速檢索查詢,按索引表檢索出相關項後可直接打開柵格數據,提高柵格數據的管理效率。
2.矢量數據
本系統採用圖屬一體化思想即將空間數據和屬性數據合二為一,全部存在一個記錄集中的思想存儲空間數據,是目前GIS數據非常流行的存儲方法。考慮到數據的具體情況,決定採用資料庫存儲空間數據和屬性數據,部分具有少量、定型幾何信息的地理要素如水文測站、河流、湖泊等,採用圖屬一體化思想存儲其信息,而與其有關聯關系的大量、多邊化的屬性信息如水文信息,則存儲在屬性數據表中,利用唯一標識符信息建立兩表的關聯。
針對本系統空間數據的特點,系統按照「資料庫—子庫—專題(基礎數據)—層—要素—屬性」的層次框架來構築空間資料庫,按照統一的地理坐標系統來存儲空間數據,以實現對地理實體/專題要素進行分層疊加顯示。
3.多媒體數據
Oracle系統可直接存儲圖片和視頻信息,並具有較強的數據管理能力,可以實現多媒體信息的快速檢索和提取。多媒體數據存儲的關鍵是建立索引表,本系統多媒體數據的存儲按類型、時間、內容等項目建立索引,直接存儲於Oracle資料庫中。
多媒體數據存儲時,可以將多媒體內容與索引表結構合為一體,採用大二進制格式直接存儲,這種存儲方式可實現內容的快速檢索和查詢,按索引表檢索出相關項後可直接打開多媒體內容,而且多媒體資料庫也便於維護管理。
(三)空間索引設計
1.矢量空間索引
確定合適的格網級數、單元大小是建立空間格網索引的關鍵。格網太大,在一個格網內有多個空間實體,查詢檢索的准確度就低。格網太小,則索引數據量成倍增長和冗餘,檢索的速度和效率低。每一個數據層可採用不同大小、不同級別的空間索引格網單元,但每層級數最多不能超過三級。索引方式設置遵循以下基本原則:
(1)對於簡單要素的數據層,盡可能選擇單級索引格網,減少RDBMS搜索格網單元索引的級數,縮短空間索引搜索的過程;
(2)如果數據層中的要素封裝邊界大小變化比較大,應選擇2或3級索引格網;
(3)如果用戶經常對圖層執行相同的查詢,最佳格網的大小應是平均查詢范圍的1.5倍;
(4)格網的大小不能小於要素封裝邊界的平均大小。為了減少每個格網單元有多個要素封裝邊界的可能性,格網單元的大小應取要素封裝邊界平均大小的3倍;
(5)格網單元的大小不是一個確定性的問題,需要多次嘗試和努力才會得到好的結果。有一些確定格網初始值的原則,用它們可以進一步確定最佳的格網大小。
SDE(Spatial Data Engine,即空間數據引擎),從空間管理的角度看,是一個連續的空間數據模型,可將地理特徵的空間數據和屬性數據統一集成在關系型資料庫管理系統中。關系型資料庫系統支持對海量數據的存儲,從而也可實現對空間數據的海量存儲。空間數據可通過層來進行數據的劃分,將具有共同屬性的一類要素放到一層中,每個資料庫記錄對應一層中一個實際要素,這樣避免了檢索整個數據表,減少了檢索的數據記錄數量,從而減少磁碟輸入/輸出的操作,加快了對空間數據查詢的速度。
ArcSDE採用格網索引方式,將空間區域劃分成合適大小的正方形格網,記錄每一個格網內所包含的空間實體(對象),以及每一個實體的封裝邊界范圍,即包圍空間實體的左下角和右上角坐標。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然後通過格網號,就可以快速檢索到所需的空間實體。因此確定合適的格網級數、單元大小是建立空間格網索引的關鍵,太大或太小均不合適,這就需要進行多次嘗試,確定合適的網格大小,以保證各單元能均勻落在網格內。利用ArcSDE的索引表創建功能,記錄每一網格單元的實體分布情況,形成圖層空間索引表。根據空間索引表,ArcSDE實現了對空間數據的快速查詢。
2.柵格數據空間索引
柵格數據的空間索引通過建立多級金字塔結構來實現。以高解析度柵格數據為底層,逐級抽取數據,建立不同解析度的數據金字塔結構,逐級形成較低解析度的柵格數據。該方法通常會增加20%左右的存儲空間,但卻可以提高柵格數據的顯示速度。在資料庫查詢檢索時,調用合適級別的柵格數據,可提高瀏覽和顯示速度。
(四)入庫數據校驗
入庫數據的質量關繫到系統評價分析結果的准確性。數據在生產中就需要嚴格進行質量控制。依據數據生產流程,將數據質量控制分成生產過程式控制制和結果控制。生產過程式控制制包括數據生產前期的質量控制、數據生產過程中的實時質量控制,結果質量控制為數據生產完成後的質量控制(裴亞波等,2003)。對入庫數據的校驗主要是進行數據生產完成後的質量控制和檢查。
1.規范化檢查
(1)代碼規范化:所有地理代碼盡量採用國家標准和行業標准,例如,行政代碼採用中華人民共和國行政區劃代碼國標。
(2)數據格式規范化:所有數據採用標准交換數據格式,例如,矢量數據採用標准輸出Coverage格式和E00格式。
(3)屬性數據和關系數據欄位規范化:所有屬性數據和關系數據提前分門別類地設計欄位的內容、長短和格式,操作過程中嚴格執行。
(4)坐標系統規范化:本系統所有與空間有關的數據採用統一的空間坐標系統,即地理坐標系統。
(5)精度規范化:所有數據按照數據精度與質量控制中所要求的精度進行採集和處理。
(6)命名規范化:所有數據按照命名要求統一命名,便於系統的查詢。
(7)元數據規范化:依照元數據標准要求,進行元數據檢查。
2.質量控制
數據質量是GIS成敗的關鍵。對於關系型資料庫設計,只要能保證表的實體完整性和參照完整性,並使之符合關系資料庫的三個範式即可。對於空間資料庫設計,則不僅要考慮數據采樣、數據處理流程、空間配准、投影變換等問題,還應對數據質量做出定量分析。
數據質量一般可以通過以下幾個方面來描述(吳芳華等,2001):
(1)准確度(Accuracy):即測量值與真值之間的接近程度,可用誤差來衡量;
(2)精度(Precision):即對現象描述得詳細程度;
(3)不確定性(Uncertainty):指某現象不能精確測得,當真值不可測或無法知道時,就無法確定誤差,因而用不確定性取代誤差;
(4)相容性(Compatibility):指兩個來源不同的數據在同一個應用中使用的難易程度;
(5)一致性(Consistency):指對同一現象或同類現象表達的一致程度;
(6)完整性(Completeness):指具有同一準確度和精度的數據在類型上和特定空間范圍內完整的程度;
(7)可得性(Accessibility):指獲取或使用數據的容易程度;
(8)現勢性(Timeliness):指數據反映客觀現象目前狀況的程度。
塔里木河流域生態環境動態監測系統的所有數據在數據質量評價後,還需要從數據格式、坐標一致性等方面進行入庫質量檢驗,只有通過質量檢驗的數據才可以入庫。
3.數據檢驗
空間數據質量檢驗包括以下步驟:
(1)數據命名是否規范,是否按設計要求命名;
(2)數據是否能夠正常打開;
(3)投影方式是否正確;
(4)坐標系統是否正確;
(5)改錯是否完成,拓撲關系是否建立;
(6)屬性數據是否正確,包括欄位設置是否依據設計進行、是否有空屬性記錄、是否有屬性錯誤記錄等。
關系數據質量檢驗包括以下步驟:
(1)數據命名是否規范,是否按設計要求命名;
(2)數據是否能夠正常打開;
(3)數據欄位是否按設計要求設置;
(4)是否有空屬性記錄;
(5)是否有屬性錯誤記錄。
屬性數據的校驗,主要採用以下三種方式:
(1)兩次錄入校驗:對一些相互之間毫無關聯的數據,進行兩次的錄入,編寫程序對兩次錄入的結果進行比較,找出兩次錄入結果不一樣的數據,查看正確值,進行改正。
(2)折線圖檢驗:對一些相互之間有關聯的序列數據,如人口統計數據,對這一類數據,編寫程序把數據以折線圖的形式顯示在顯示器上,數據的序列一般都有一定規律,如果出現較大的波動,則需對此點的數據進行檢查修改。
(3)計算校驗:對一些按一定公式計算後所得結果與其他數據有關聯的數據,如某些數據的合計等於另一數據,編寫程序對這類數據進行計算,計算結果與有關聯的數據進行比較,找出結果不一樣的數據,查看正確值,進行改正。
圖形數據的校驗,主要包括以下步驟(陳俊傑等,2005):
(1)圖層校驗:圖形要素的放置圖層是唯一的。對於入庫的Coverage數據,系統將根據圖層代碼進行檢查,確保圖形要素對層入座。
(2)代碼檢查:圖形要素的代碼是唯一的。對於入庫的Coverage數據,系統將根據入庫要素代碼與特徵表中的代碼進行比較,確保入庫數據代碼存在,杜絕非法代碼入庫。
(3)類型檢查:對入庫的數據,檢查該要素的類型與特徵表中的類型是否一致,確保圖形要素對表入座。如點要素、線要素、面要素僅能賦相應的點、線、面代碼,且該代碼必須與特徵表中的數據類型代碼相同。
(4)范圍檢查:根據入庫的數據,確定該類要素的大體范圍(如X、Y坐標等),在數據入庫前,比較入庫數據與范圍數據的大小,若入庫數據在該范圍內,則入庫,否則給出提示檢查信息。
(五)數據入庫
1.遙感影像數據
利用空間數據引擎———ArcSDE可實現遙感影像數據在Oracle資料庫中的存儲和管理,在影像數據進行入庫時,應加入相應的索引和影像描述欄位。
遙感影像入庫步驟:
(1)影像數據預處理:要將塔里木河遙感影像資料庫建成一個多解析度無縫影像資料庫系統,客觀上要求資料庫中的影像數據在幾何空間、灰度空間連續一致。因此,在數據採集階段就需要對影像數據進行預處理,包括圖像幾何校正、灰度拼接(無縫鑲嵌)、正射處理、投影變換等。
幾何校正的目的是使校正後的圖像重新定位到某種地圖投影方式,以適用於各種定位、量測、多源影像的復合及與矢量地圖、DTM等的套合顯示與處理。幾何校正多採用二次多項式演算法和圖像雙線性內插重采樣法進行圖像校正。將糾正後具有規定地理編碼的圖像按多邊形圈定需要拼接的子區,逐一鑲嵌到指定模版,同時進行必要的色彩匹配,使整體圖像色調一致,完成圖像的幾何拼接,再採用金字塔影像數據結構和「從粗到精」的分層控制策略實現逐級拼接。
數字正射影像具有統一的大地坐標系、豐富的信息量和真實的景觀表達,易於製作具有「獨立於比例尺」的多級金字塔結構影像。可以採用DTM和外方位元素經過數字微分糾正方法,獲得數字正射影像,它的基本參數包括原始影像與正射影像的比例尺、采樣解析度等(方濤等,1997)。
投影變換需根據資料庫系統定義的標准轉換到統一的投影體系下。
(2)影像數據壓縮:隨著感測器空間解析度的提高和對遙感信息需求的日益增長,獲取的影像數據量成幾何級數增大,如此龐大的數據將佔用較大的存儲空間,給影像的存儲和傳輸帶來不便(葛詠等,2000)。目前,系統處理的遙感影像數據已達數百千兆,單個文件的影像數據最大達到了2G,這樣的數據量在調用顯示時速度很慢,對影像數據進行壓縮存儲,將大大提高影像訪問效率。本系統採用ArcSDE軟體提供的無損壓縮模式對入庫影像進行壓縮。
(3)影像導入:遙感影像的入庫可通過ArcSDE或入庫程序進行導入,並填寫相關的索引信息,在入庫時對大型的遙感影像數據進行自動分割,分為若乾的塊(tiles)進行存儲。
(4)圖像金字塔構建:採用ArcSDE提供的金字塔構建工具在入庫時自動生成圖像金字塔,用戶只需要選擇相應的參數設置即可。圖像金字塔及其層級圖像按解析度分級存儲與管理。最底層的解析度最高,並且數據量最大,解析度越低,其數據量越小,這樣,不同的解析度遙感圖像形成了塔式結構。採用這種圖像金字塔結構建立的遙感影像資料庫,便於組織、存儲與管理多尺度、多數據源遙感影像數據,實現了跨解析度的索引與瀏覽,極大地提高了影像數據的瀏覽顯示速度。
2.數字線劃圖
對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和拼接存儲的數字矢量圖,就可以進行圖形數據入庫。
(1)分幅矢量圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。
(2)拼接矢量圖形數據:按圖形比例尺、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。
3.柵格數據
對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和整體存儲的數字柵格圖,然後進行圖形數據入庫。
(1)分幅柵格圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。
(2)整幅柵格圖形數據:按比例尺、製作時間等方式,通過入庫程序導入到資料庫中。
4.數字高程模型
(1)分幅數字高程模型數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。
(2)拼接數字高程模型數據:按比例尺、製作時間等方式通過入庫程序導入到資料庫中。
5.多媒體數據
多媒體數據入庫可根據多媒體資料庫內容的需要對入庫數據進行預處理,包括音頻、視頻信息錄制剪接、文字編輯、色彩選配等。對多媒體信息的加工處理需要使用特定的工具軟體進行編輯。由於音頻信息和視頻信息數據量巨大,因此,對多媒體數據存儲時需採用數據壓縮技術,現在的許多商用軟體已能夠直接存儲或播放壓縮後的多媒體數據文件,這里主要考慮根據數據顯示質量要求選擇採用不同的存儲格式。圖4-2為各類多媒體數據的加工處理流程。
圖4-2 多媒體數據加工處理流程圖
6.屬性數據
將收集的社會經濟、水利工程、生態環境等屬性資料,進行分析整理,輸入計算機,最後經過程序的計算處理,存儲到資料庫中,具體流程如圖4-3所示。
圖4-3 屬性數據入庫流程圖
㈡ 圖片資料庫怎麼建立
在建立資料庫是應該想好各個數據之間的關系,需要存儲哪些數據,這些數據直接是一對一,一對多還是多對
一得
關系。一般保存圖片數據的話不建議直接保存圖片,而建議保存圖片的地址,大致需要這回么幾個欄位,
主鍵
,圖片的
絕對地址
,圖片答的大小,圖片的名稱等等
㈢ 圖像控制點庫的建立及應用方法探討
曾福年 趙翠玲
(中國國土資源航空物探遙感中心,北京,100083)
摘要:本文探討了建立SPOT5圖像控制點資料庫的原理和方法,介紹了如何建立適合於SPOT5校正的控制點資料庫,並提取控制點與待糾正影像進行自動或人工干預匹配,尋找預正射影像上的同名點建立控制點對,實現對影像的幾何糾正。
關鍵詞:SPOT5圖像;控制點資料庫;匹配;幾何糾正
1 引言
SPOT5圖像的正射糾正是土地動態監測項目中圖像處理的一個基本過程,無論是物理模型方程法還是多項式糾正法,都需要利用地面控制點來解算轉換矩陣以實現幾何糾正。目前,土地動態監測項目已經開始建立許多的圖像控制點,包括正射糾正後的航空或高分辨遙感數字圖像控制點、掃描糾正後的大比例數字地形圖上圖形控制點和新測的野外GPS圖像控制點。但這些控制點要有效地利用起來,其關鍵是有效地管理這些控制點。這些控制點應該在使用後被存儲,再次使用時可以重新調用和更新。因此,建立控制點資料庫以實現控制點的有效利用就非常必要了。由於圖像控制點的特殊性,本文就圖像控制點資料庫的建立和使用方法進行闡述。
圖像控制點就是包含具有地理位置信息的一個地物的圖像,其存儲格式是帶地理信息的柵格形式。圖像控制點是利用影像之間的匹配來尋找預正射影像上的同名點,從而可以避免傳統控制點的標志在預正射影像上不易於識別的困難。在計算機軟硬體和模式識別技術的支持下,利用圖像控制點來代替傳統的控制點進行幾何糾正,可以大大減輕勞動強度和提高作業效率與糾正精度。
2 圖像控制點庫建立
圖像控制點資料庫的根本目的是用來對控制點進行有效的管理並方便地提取控制點來實現圖像的幾何糾正。這要求資料庫的設計應圍繞著控制點的使用來進行。在進行SPOT5幾何糾正時,待糾正影像的概略空間范圍是根據SPOT5 的軌道參數已知的,控制點就是按照這個范圍來提取的。控制點資料庫首先實現以空間范圍為基礎的控制點查詢是控制點資料庫的最基本功能,同時,每一個圖像控制點都包含兩種數據,圖像數據和屬性數據,這兩種數據的連接是應用控制點資料庫的重要依據。應用控制點資料庫應使用帶有自動位置預測的遙感軟體。圖像控制點資料庫的設計就是根據這三個基本原則來進行的。
2.1 圖像控制點來源
圖像控制點是以圖像為基礎,以矢量為輔的文件。
(1)把正射糾正後的航空或遙感數字圖像上裁剪下來的典型區域的一小塊范圍的圖像作為圖像控制點。
(2)根據野外GPS控制點坐標,在原始圖像上標注控制點的位置,並附帶有原數據說明文檔和實地數碼相片。
(3)從掃描糾正後的數字地形圖上得到的典型地物區域的一小塊范圍的數字圖像作為圖像控制點。
(4)圖像控制點參考坐標系統應與要求的成果圖像的坐標系統一致。
2.2 基礎控制點庫的內容
控制點庫是管理圖像控制點的,圖像控制點包含兩種數據:圖像數據和屬性數據。無論採用何種方式採集的圖像控制點,都同時具有這兩種數據。圖像數據和屬性數據分開存放在不同的庫體之中,圖像數據的存儲格式是柵格形式,而且屬性數據的存儲格式是矢量形式。圖像數據和屬性數據必須建立存放在不同的庫體之中的連接。
2.2.1 圖像數據
圖像控制點是以柵格形式存儲的包含某一個明顯地物的圖像。在資料庫中,由於柵格圖像的特殊性,它無法像屬性數據以一條記錄來存儲,每一個圖像都是以柵格文件存儲在一定的目錄下,按目錄來進行管理。圖像的大小一般在100×100像素和200×200像素之間,以能包含一明顯地物為准。圖像控制點區別於傳統的控制點就在於它有圖像數據。圖像中的明顯地物是指在一定的范圍內可以區別於周圍其他地物的,可以是一個道路的交叉口,也可以是一個小河流的拐彎處,甚至可以是一個小島。它的特點使得它在傳統的控制點無法確定的區域能夠選點進行幾何糾正。
2.2.2 屬性數據
屬性數據是用來描述控制點的地理位置等關系的。一組圖像要當作控制點來進行幾何糾正,它們必須具有在某一確定的投影空間的正確的相互位置關系。圖像控制點的地理位置就是由它們的屬性數據來描述的,為了正確描述地理位置關系,每一個控制點的屬性數據要具有和影像數據進行聯結的一致ID標識號,以實現圖像數據與屬性數據的正確連接。所有控制點的屬性數據格式是相同的,因此屬性資料庫是關系資料庫,每一個圖像控制點的屬性以規定的格式記錄。屬性數據記錄包括:圖像控制點來源;控制點坐標;數據說明;參考橢球;影像的比例尺;超級連接的野外GPS控制點數碼相片。
2.2.3 坐標系統
所有的圖像控制點都是投影到一定的參考坐標系統里的。為了提高資料庫的使用性能,正確表示控制點在整個資料庫范圍內的相互地理位置關系,控制點應該採用統一的坐標系統,以利於控制點的正確查詢提取與使用。
2.3 控制點庫的結構
不同地區的控制點數目不同,大范圍地區的控制點數據量非常大。大范圍地區單一的一個資料庫對於控制點的查詢使用是非常不便的,會降低資料庫的性能,因此為了快速方便地查詢提取控制點,就要以索引的方式來層層建庫,形成一個樹形結構的控制點庫體。由於控制點是按空間的地理位置來分布的,因此按地理位置范圍來將一個大的區域分為幾個小的區域是合理的,而且可以根據實際的情況來對小的區域進行進一步的細分,由此從上到下建立一級一級的索引資料庫。
頂級資料庫是全局資料庫,它描述的是整個建庫范圍內的分區資料庫的信息,也是關系資料庫。它的記錄描述的內容是:子資料庫的名稱,子資料庫所包含的范圍信息等。根據實際的情況,子資料庫中描述的可以是再下一級的資料庫的信息,也可以是控制點的信息。
圖1 樹形資料庫結構
在這個樹形的資料庫結構中,葉子資料庫處在最基礎位置,描述的是圖像控制點的信息。當要從資料庫中提取控制點時,就可以從頂端的資料庫一層一層地向下查詢,直至葉子資料庫查詢基礎控制點庫的內容,見圖1。
從結構圖看出,由於圖像和屬性數據是以文件存放在某一確定的目錄中,圖像資料庫的管理實際就是對文件目錄的管理。合理的組織文件目錄才能夠實現圖像數據與屬性數據的連接,這就要求目錄的結構與命名和屬性資料庫要一致。
3 控制點庫的應用
圖像控制點庫的目的就是有效地組織管理控制點,方便地提取某一影像范圍內的控制點來進行幾何糾正。一景待糾正的SPOT5 影像,由於原始數據軌道參數的導入,可以得到它的一個帶有地理信息的影像。根據這個地理信息范圍,從最上一級的控制點資料庫開始,找到這一影像所在范圍的子資料庫,再進入下一級資料庫,進行同樣的判斷,直至最底層的資料庫,就可以提取出位於這一影像范圍內的圖像控制點,進行幾何糾正。
一個控制點一旦被提取出來,就可以獲取它的地理位置數據,根據它的位置和待糾正遙感影像的地理信息,可以自動匹配控制點在影像上的大致位置范圍,在這一范圍內進行搜索,可以大大縮小同名點匹配的搜索過程,提高匹配的速度和精度。
在使用控制點時,不管 GPS 控制點還是圖像控制點,簡單的方法是在待糾正的影像上標識出控制點的大致范圍,這可以僅根據控制點的地理坐標和影像的范圍來獲取,然後用滑鼠在計算機屏幕上通過點擊來獲取控制點的同名點的影像像素坐標。要實現幾何糾正的自動化,就要利用影像的匹配技術來進行控制點與待糾正影像上的同名點的自動匹配。根據控制點的種類的不同,採取不同的匹配技術來進行。控制點資料庫中應用過程參見圖2。
圖2 控制值資料庫應用過程
3.1 遙感數字圖像控制點配准方法
對正射糾正後的航空或遙感數字圖像上裁剪下來的典型區域的一小塊范圍的圖像作為圖像控制點採用基於區域特徵的和基於點特徵的配准方法。
3.1.1 基於區域的配准方法
基於區域的配准方法是將待配准圖像中一塊區域與參考圖像中的相同尺寸的區域從統計學上進行比較,其相似度評測標準是從兩塊區域的標准化交叉相關系數中取最大值者。也可以通過FFT變換將圖像由時域變換到頻域,然後再進行配准。對位移量比較大的圖像,可以先校正圖像的旋轉,然後建立兩幅圖像之間的映射關系。但如果圖像中存在比較大的雜訊和灰度差異時,這個交叉相關測量標准就變得不可靠。
3.1.2 基於點特徵的配准方法
基於點特徵的配准方法有較高的性能。它有兩個過程:特徵抽取和特徵配准,一系列的圖像分割技術都被用到特徵的抽取和邊界檢測上。如Canny運算元、拉普拉斯高斯運算元、區域生長運算元。抽取出來的空間特徵有閉合的邊界、開邊界、交叉線以及其他特徵。特徵匹配的演算法有:交叉相關、距離變換、動態編程、結構匹配等演算法。
3.2 GPS 控制點配准方法
對野外GPS控制點在原始圖像上標注控制點的位置和掃描糾正後的數字地形圖上得到的典型地物區域的一小塊范圍的數字圖像作為控制點採用人工匹配同名點的方法。
由於地形圖控制點所提供的僅是地物的一個結構信息,類似於影像的紋理。它不反映地物的光譜信息,與待糾正影像上的內容不一致;它不能利用控制點片中的數據直接來進行影像匹配。因此,只能利用這一個結構信息採用人工匹配同名點的方法,在可以自動預測控制點在影像上的大致位置范圍內,根據影像的紋理特徵尋找控制點的同名點。
綜合上述方法,在對足夠數目的控制點進行匹配找到同名點後,就可以根據這些控制點解算轉換矩陣實現幾何糾正。
圖像控制點庫的建立是一項基礎的工作,大量的數據要輸入資料庫。一旦資料庫建立起來,可以利用最新的遙感數據進行更新,當需要利用控制點對新的遙感數據進行幾何糾正時,可以方便快捷地提取控制點,提高工作效率,為土地調查工作提供技術保障。
參考文獻
Barbara Zitová and Jan Flusser.「Image registration methods:a survey.」Imaging and VisionComputing,vol.21,pp.977~1000,2003
張祖勛,張劍清.數字攝影測量學.武漢:武漢測繪科技大學出版社,1996
張祖勛、張劍清.山區遙感(RS)影像的小面元微分糾正.第三屆海峽兩岸測繪發展研討會論文集,2000,12
陳躍峰,肖自美.基於內容查詢的圖像資料庫系統模型[J].中國圖像圖形學報,1997
㈣ 高解析度影像數據處理及數據建庫技術方法研究
潘振祥
(河南省國土資源廳信息中心 鄭州 450016)
摘 要:本文通過開展高解析度衛星遙感影像數據(SPOT5)處理及建庫技術方法研究和探索,制定了《高解析度影像數據處理及基於遙感影像土地利用資料庫建設技術要求》和《省級基於遙感影像 1∶1 萬土地利用資料庫標准》,製作了覆蓋河南全省的 1∶1 萬數字正射影像圖,建立了河南省基於 SPOT 5 的 GPS 像控點圖形圖像資料庫、高解析度衛星影像資料庫和基於影像信息土地利用資料庫,為全國土地利用二次調查基礎底圖製作進行了有益的探索。
關鍵詞:土地資源 衛星影像 遙感 資料庫 像控點
0 引 言
隨著信息技術的快速發展,衛星遙感影像處理技術得到了突破性進展,高解析度衛星影像在土地資源調查評價、土地利用動態遙感監測、土地執法監察、土地變更調查以及大中比例尺地形圖測繪等方面應用已取得顯著成效。
針對河南省高解析度遙感影像數據處理及資料庫建設項目任務,項目組提出了利用 GPS 外業靜態實測坐標作為影像數據校正的控制資料,制定了《高解析度影像數據處理及基於遙感影像土地利用資料庫建設技術要求》和《省級基於遙感影像 1∶1 萬土地利用資料庫標准》等,並根據項目任務要求,制定了切合河南實際的基於遙感影像信息的土地利用分類體系,同時,通過項目開展,製作了覆蓋河南全省的 SPOT 5 數字正射影像圖(DOM),並建立了河南省基於 SPOT 5的 GPS 像控點圖形圖像資料庫,為土地利用二次調查基礎底圖製作進行了有益的探索。
1 影像數據處理及資料庫建設技術路線
(1)多源遙感信息相結合。選取最佳波段組合的多光譜影像與高解析度全色影像融合,生產具有高解析度空間信息和豐富光譜信息的融合影像。
(2)GPS 像控點、基礎圖件(資料庫)和 DEM 相結合。根據實際情況,採用 GPS 像控點,同時利用 1∶5 萬 DEM 對遙感影像進行正射校正。
(3)人機交互與計算機自動提取相結合。以人機交互解譯為主,進行土地分類信息提取。
(4)遙感解譯與地面調查相結合。對提取的地類圖斑信息進行外業驗證,對在室內不確定的地類圖斑,進行外業實地調查。
2 GPS 像控點圖形圖像資料庫建立
為保證像控點選取精度,首先在 2.5 m 解析度的全色影像上,按照像控點選取的技術要求,每景均勻選取了 25 個像控點,並對像控點進行了全外業 GPS 靜態測量,在 MapGIS 平台下編輯像控點屬性結構,建立 GPS 像控點圖形圖像資料庫,並將像控點外業測量成果表以圖片方式保存在屬性表中。如圖1所示。
圖1 像控點圖形圖像資料庫示意圖
2.1 GPS 像控點選取
為保證像控點外業測量精度,像控點選取時,點位分布要相對均勻,特徵明顯,交通便利,數量足夠,盡可能在全色影像上選取,盡量避開高壓線、大面積水域等干擾因素。
為提高外業測量效率,將選取的待測像控點製作成「像控點外業測量成果表」,成果表包括像控點編號、點位及放大的示意圖、WGS84、1954 北京、1980 年西安三套坐標和點位說明等內容。
2.2 GPS 像控點外業施測
像控點外業測量採用附合路線法,各像控點平均間距約 13 km,像控點與 C 級 GPS 控制點組成 GPS 控制網。GPS 像控點外業測量利用河南省 C 級 GPS 控制網成果的三套數據(分別為WGS 84、1954 北京和 1980 年西安坐標)作為起算數據,依據《全球定位系統(GPS)測量規范》,採用靜態方式同步進行觀測,三台套 GPS 接收機為一組,觀測時段長度不少於 45 分鍾,衛星高度角≥ 15°,有效觀測衛星總數≥ 4 個。測量數據採用南方測繪軟體進行基線解算、平差處理並進行高程擬合,最後解算出像控點基於三套坐標系統的三套數據和擬合高程。
2.3 GPS 像控點圖形圖像資料庫的建立
GPS 像控點圖形圖像資料庫以河南省 1∶50 萬地理底圖作為工作底圖,輸入像控點空間坐標,並採集像控點屬性與圖形信息,建立數學基準統一的像控點圖形圖像文件。像控點圖形圖像信息,除像控點所具有的地理坐標信息之外,還包括與待糾正影像相關的特徵地物的紋理信息、解析度信息等。
3 影像數據處理
影像數據處理包括衛星影像全色數據與多光譜數據的配准、融合和影像數據正射校正、鑲嵌及正射影像圖(DOM)的製作等。本項目所使用到的 SPOT 5 數據是由視寶公司提供的 1A 級數據,只經過了探測器的均衡化處理,為了進行多元數據的復合,製作正射影像圖,必須對圖像進行正射校正,建立地理坐標。影像數據處理技術流程如圖 2 所示。
圖2 影像數據處理技術流程
3.1 影像配准
本項目使用的單景多光譜數據與全色數據是同步接收到的,其圖形的幾何相關性較好,多光譜數據與全色配准難度小、精度高,因此採用相對配準的方法,SPOT 5 多光譜數據波段組合採用 XS2(紅)、XS3(綠)、XS1(藍)形式,影像重采樣間隔為 2.5 m,重采樣方法採用雙線性內插,以景為配准單元,以 SPOT 5 全色數據為配准基礎,均勻選取配准控制點,對接收側視角較大,地勢起伏對配准影響較為嚴重的區域相應增加控制點密度,將 SPOT 5 多光譜數據與之精確配准,並隨機選擇配准後全色與多光譜數據上的同名點進行檢查,以確保數據的配准精度。
3.2 影像融合
圖像融合處理採用最基本的乘積組合演算法直接對兩種空間解析度的遙感數據進行合成,融合後圖像則採用直方圖調整、USM 銳化、彩色平衡、色度飽和度調整和反差增強等手段,以使整景影像色彩均勻、明暗程度適中、清晰,增強專題信息,特別是加強紋理信息。
3.3 影像正射校正
影像正射校正採用 ERDAS 的 LPS 正射模塊,利用 SPOT 5 物理模型,每景 25 個像控點均勻分布於整景影像,各相鄰景影像重疊區有 2 個以上共用點。正射校正以實測點和 1∶5 萬 DEM為校正基礎,以景為單元,對融合後的數據進行正射校正,采樣間隔為 2.5 m。
3.4 影像鑲嵌
影像鑲嵌採用 ERDAS 的 LPS 正射模塊中批量處理模塊,相鄰兩幅影像,均採集了兩個以上共用點,大大提高了影像鑲嵌精度。為驗證鑲嵌精度,以縣(市、區)為單位,在其鑲嵌區隨機選擇 25 個以上檢查點進行鑲嵌精度檢查。
3.5 數字正射影像圖製作
數字正射影像圖(DOM)製作採用 Image Info 工具,按照 1∶1 萬標准分幅進行裁切,覆蓋完整的縣級行政轄區。圖幅整飾依據《高解析度影像數據處理及資料庫建設技術要求》,利用MapGIS 資料庫平台,按照 1954 北京坐標系、1985 年國家高程基準的生成 1∶1 萬標准分幅圖幅整飾。
4 創新成果
項目組在圓滿完成項目任務的前提下,結合項目進展和土地管理需要,創造性地開展工作。總結項目進展和取得的成果,創新成果主要體現在:
(1)影像校正控制點 GPS 外業實測數據作為影像校正控制資料,改變了以往利用地形圖、土地利用現狀圖(資料庫)作為控制資料的傳統方式,極大地提高了影像校正精度,節省了項目投入經費。
覆蓋河南全省 1∶1 萬標准分幅地形圖共計 6565 幅,而實有地形圖僅 5600 余幅,項目組在徵求部課題組同意的前提下,提出採用 GPS 外業實測控制點作為影像校正控制資料的思路。基於這一思路,項目組進行了一系列研究和論證,制定了 GPS 外業測量技術要求,並對覆蓋全省的每景 SPOT 5 衛星影像相對均勻地選取了 25 個控制點,相鄰景影像不少於 2 個共用控制點的原則,全省共選取影像校正控制點 1421 個,GPS 大地控制 C 級點 94 個。根據影像數據接收時間和項目進度,共分 13 個測區,對所有控制點採用附和路線法進行了靜態測量,分別計算出各控制點和檢查點的 WGS84、1954 北京和 1980 年西安三套坐標。
(2)河南省像控點圖形圖像資料庫的建立,為今後河南全省土地利用遙感監測、衛片執法監察等提供了技術保障。
為使外業測量成果長期保存和今後使用,項目組在項目任務之外,在 MapGIS 平台上,基於河南省 1∶50 萬地理底圖,建立了 GPS 像控點圖形圖像資料庫。GPS 像控點圖形圖像資料庫的建立,不僅滿足 SPOT 5_2.5 m 高解析度衛星影像的校正精度要求,同時為今後河南全省土地利用遙感監測、衛片執法檢查、礦山環境監測等奠定了基礎。
(3)高解析度影像數據大區域整體正射校正和鑲嵌處理技術的探索,為影像數據批處理技術的推廣進行了有益的探索。
由於本次試點項目涉及的范圍廣、影像處理工作量大,因此,項目組在保證影像糾正精度的前提下,為提高工作效率,探索和使用了遙感影像專業處理軟體 ERDAS 的 LPS 模塊提供的大區域整體正射糾正和影像鑲嵌處理功能,達到了較好的應用效果。
鑒於本次試點項目所使用的影像數據均為同步接收的 SPOT 5 多光譜與全色數據,其圖形的幾何相關性較好,多光譜數據與全色配准難度小、精度高,因此,影像數據處理採用先單景融合、後大區域整體正射校正、最後進行大區域鑲嵌配準的技術流程進行影像處理。
正射糾正採用 ERDAS 的 LPS 批量正射模塊。糾正採用 SPOT 5 物理模型,控制點均勻分布於整景影像,每景控制點個數為 25 個,各相鄰影像重疊區有 2 個以上共用點。正射糾正以 GPS外業實測控制點和預處理的河南省 1∶5 萬 DEM 為糾正基礎 , 對 SPOT 5 融合數據進行批量糾正,采樣間隔為 2.5 m。影像鑲嵌採用的是 ERDAS 的 LPS 批處理模塊,由於各相鄰景影像均採集了兩個以上的共用點,大大提高了影像鑲嵌精度。
(4)基於遙感影像信息土地利用分類標准體系的制定,為國家和省級快速掌握和提取土地利用變化信息進行了有益的探索。
項目組根據部課題組要求及國家和省土地管理工作需要,結合 SPOT 5 衛星影像光譜特徵和紋理信息,經充分研究和論證,制定了切合河南實際、滿足「高解析度影像數據處理及資料庫建設」試點項目需要的基於遙感影像信息的土地利用分類標准,該標准中將土地利用類型分為農用地、建設用地和未利用地等 3 個大類,耕地、園林地、其他農用地、城市用地、建制鎮用地、農村居民點用地、鐵路用地、公路用地、其他建設用地、未利用地等 10 個二級類,此外,根據個別地類特點,又分別從農用地、建設用地和未利用地中單獨劃分出公路林帶、農業水利用地、水利設施用地、未利用水面和黃河灘地等 5 個三級類,分類標准與現有的土地利用分類體系協調、一致,符合國土資源土地分類標准體系。
(5)基於遙感影像土地利用資料庫建設,為國家和省土地宏觀管理提供了現勢性較強的土地利用電子數據,為國內同類工作的開展提供了技術依據。
考慮到國家和省級土地宏觀管理的需要,根據項目制定的「基於遙感影像土地利用分類體系」,結合中地公司 MapGIS 土地利用資料庫管理系統框架結構,項目組在 MapGIS 資料庫管理系統平台的基礎上,分別制定了《高解析度影像數據處理及資料庫建設技術要求》和《基於遙感影像 1∶1 萬土地利用資料庫標准》等,並在標准中明確了基於遙感影像的土地分類、文件命名規則、數據分層格式及要求等,保證了數據標准和數據格式的一致性及資料庫建設質量,為國家和省提供了翔實的土地利用現勢數據。
5 結 語
隨著遙感技術和計算機技術的飛速發展,高解析度遙感影像數據在土地管理工作中的應用越來越普遍,同時,遙感影像數據處理的技術手段也越來越科學、越來越先進,尤其是全國第二次土地調查工作的全面開展,將遙感影像在土地管理方面的應用推到一個前所未有的水平,因此,如何在影像數據處理過程中盡可能減少人力和財力投入已顯得尤為重要。本項目針對上述問題,在科研與生產過程中,提出的採用 GPS 外業實測控制點作為影像校正控制資料、GPS 像控點圖形圖像數據建庫及基於國家和省級土地管理需要而提出的基於遙感影像信息土地利用資料庫標准等,進行了較好的詮釋,為今後同類工作的開展進行了有益的探索。
參 考 文 獻
常慶瑞,等.2004.遙感技術導論[M]. 北京:科學出版社
陳述彭,等.1998.遙感信息機理研究[M].北京:科學出版社
黨安榮,等.2003.ERDAS IMAGING 遙感圖像處理方法[M].北京:清華大學出版社
湯國安,等.2004.遙感數字影像處理[M]. 北京:科學出版社
徐柏清.1988.正射投影技術與影像地圖[M].北京:測繪出版社
尤淑撐,劉順喜.2002.GPS 在土地變更調查中的應用研究[J].測繪通報(5):1~3
張繼賢,等.2000.圖形圖像控制點庫及應用[J].測繪通報(1)
(原載《測繪通報》2008 年第 10 期)
㈤ 如何建立圖像資料庫
建立,SQLSERVER實現
CREATE TABLE dbo.服裝圖片 (
id int IDENTITY (1, 1) NOT NULL ,
標題 varchar (50) ,
說明 text ,
存放路徑 varchar (50),
圖片尺寸 varchar (50),
其它屬性 varchar (50)
)
操作:
前台語言編寫,可按標題等屬性查詢圖片,或通過GRID控制項顯示列表,通過調入的存放路徑和文件名字串調入到圖片控制項顯示圖片。
㈥ 教你輕松掌握數據倉庫的規劃和構建策略
教你輕松掌握數據倉庫的規劃和構建策略
數據倉庫作為決策支持系統(DSS)的基礎,具有面向主題的、集成的、不可更新的、隨時間不斷變化的特性。這些特點說明了數據倉庫從數據組織到數據處理,都與原來的資料庫有很大的區別,這也就需要在數據倉庫系統設計時尋求一個適合於數據倉庫設計的方法。在一般的系統開發規劃中,首先需要確定系統的功能,這些系統的功能一般是通過對用戶的需求分析得到的。從數據倉庫的應用角度來看,DSS分析員一般是企業中的中高層管理人員,他們對決策支持的需求不能預先做出規范的說明,只能給設計人員一個抽象地描述。
這就需要設計人員在與用戶不斷的交流溝通中,將系統的需求逐步明確,並加以完善。因此數據倉庫的開發規劃過程實際上是一個用戶和設計人員對其不斷了解、熟悉和完善的過程。 數據倉庫的開發應用規劃是開發數據倉庫的首要任務。只有制定了正確的數據倉庫規劃,才能使組織主要力量有序地實現數據倉庫的開發應用。在數據倉庫規劃中一般需要經歷這樣幾個過程:選擇實現策略、確定數據倉庫的開發目標和實現范圍、選擇數據倉庫體系結構、建立商業和項目規劃預算。 當數據倉庫規劃完成後,需要編制相應的數據倉庫規劃說明書,說明數據倉庫與企業戰略的關系,以及與企業急需處理的、范圍相對有限的開發機會,重點支持的職能部門和今後數據倉庫開發工作的建議,實際使用方案和開發預算,作為數據倉庫實際開發的依據。
1、選擇數據倉庫實現策略
數據倉庫的開發策略主要有自頂向下、自底向上和這兩種策略的聯合使用。自頂向下策略在實際應用中比較困難,因為數據倉庫的功能是一種決策支持功能。這種功能在企業戰略的應用范圍中常常是很難確定的,因為數據倉庫的應用機會往往超出企業當前的實際業務范圍,而且在開發前就確定目標,會在實現預定目標後就不再追求新的應用,是數據倉庫喪失更有戰略意義的應用。由於該策略在開發前就可以給出數據倉庫的實現范圍,能夠清楚地向決策者和企業描述系統的收益情況和實現目標,因此是一種有效的數據倉庫開發策略。該方法使用時需要開發人員具有豐富的自頂向下開發系統的經驗,企業決策層和管理人員完全知道數據倉庫的預定目標並且了解數據倉庫能夠在那些決策中發揮作用。
自底向上策略一般從某個數據倉庫原型開始,選擇一些特定的為企業管理人員所熟知的管理問題作為數據倉庫開發的對象,在此基礎上進行數據倉庫的開發。因此,該策略常常用於一個數據集市、一個經理系統或一個部門的數據倉庫開發。該策略的優點在於企業能夠以較小的投入,獲得較高的數據倉庫應用收益。在開發過程中,人員投入較少,也容易獲得成效。當然,如果某個項目的開發失敗可能造成企業整個數據倉庫系統開發的延遲。該策略一般用於企業洗碗對數據倉庫的技術進行評價,以確定該技術的應用方式、地點和時間,或希望了解實現和運行數據倉庫所需要的各種費用,或在數據倉庫的應用目標並不是很明確時,數據倉庫對決策過程影響不是很明確時使用。
在自頂向下的開發策略中可以採用結構化或面向對象的方法,按照數據倉庫的規劃、需求確定、系統分析、系統設計、系統集成、系統測試和系統試運行的階段完成數據倉庫的開發。而在自底向上的開發中,則可以採用螺旋式的原型開發方法,使用戶可以根據新的需求對試運行的系統進行修改。螺旋式的原型開發方法要求在較短的時間內快速的生成可以不斷增加功能的數據倉庫系統,這種開發方法主要適合於這樣一些場合:在企業的市場動向和需求無法預測,市場的時機是實現產品的重要組成部分,不斷地改進對與企業的市場調節是必需的;持久的競爭優勢來自連續不斷地改進,系統地改進是基於用戶在使用中的不斷發現。 自頂向下和自底向上策略的聯合使用具有兩種策略的優點,既能快速的完成數據倉庫的開發與應用,還可建立具有長遠價值的數據倉庫方案。但在實踐中往往難以操作,通常需要能夠建立、應用和維護企業模型、數據模型和技術結構的、具有豐富經驗的開發人員,能夠熟練的從具體(如業務系統中的元數據)轉移到抽象(只基於業務性質而不是基於實現系統技術的邏輯模型);企業需要擁有由最終用戶和信息系統人員組成的有經驗的開發小組,能夠清楚地指出數據倉庫在企業戰略決策支持中的應用。
2、確定數據倉庫的開發目標和實現范圍
為確定數據倉庫的開發目標和實現范圍,首先需要對企業管理者等數據倉庫用戶解釋數據倉庫在企業管理中的應用和發展趨勢,說明企業組織和使用數據來支持跨功能系統的重要性,對企業經營戰略的支持,以確定開發目標。在該階段確認與使用數據倉庫有關的業務要求,這些要求應該只支持最主要的業務職能部門,將使用精力集中在收益明顯的業務上,使數據倉庫的應用立即產生效果,不應該消耗太多的精力在各個業務上同時鋪開數據倉庫的應用。
在確定開發目標和范圍以後,應該編制需求文檔,作為今後開發數據倉庫的依據。 數據倉庫開發的首要目標是確定所需要信息的范圍,確定用戶提供決策幫助時,在主題和指標域需要哪些數據源。這就需要定義:用戶需要什麼數據?面向主題的數據倉庫需要什麼樣的支持數據?為成功地向用戶提交數據,開發人員需要哪些商業知識?哪些背景知識?這就需要定義整體需求,以文件的形式整理現存的記錄系統和系統環境,對使用數據倉庫中數據的候選應用系統進行標識、排序,構造一個傳遞模型,確定尺度、事實及時間標記演算法,以便從系統中抽取信息且將他們放入數據倉庫。通過信息范圍確定可為開發人員提供一個良好的分析平台,和用戶一起分析哪些信息是數據倉庫需要的,進行商業活動需要什麼數據。開發人員可以和用戶進一步定義需要,例如數據分級層次、聚合的層次、載入的頻率以及需要保持的時間表等。 數據倉庫開發的另一個重要目標是確定利用哪些方法和工具訪問和導航數據?雖然用戶都需要存取並且檢索數據倉庫的內容,但是所存取的粒度有所不同,有的可能是詳細的記錄,有的可能是比較概括的記錄或十分概括的記錄。用戶要求的數據概括程度不同,將導致數據倉庫的聚集和概括工具的需求不同。
數據倉庫還有具有一定功能來訪問和檢索圖表、預定義的報表、多維數據、概括性數據和詳細記錄。用戶從數據倉庫中獲得信息,應該有電子表格、統計分析器和支持多維分析的分析處理器等工具的支持,以解釋和分析數據倉庫中的內容,產生並且驗證不同的市場假設、建議和決策方案。為將決策建議和各種決策方案向用戶清楚地表達出來,需要利用報表、圖表和圖像等強有力的信息表達工具。 數據倉庫開發的其他目標,是確定數據倉庫內部數據的規模。在數據倉庫中不僅包含當前數據,而且包含多年的歷史數據。數據的概括程度決定了這些數據壓縮和概括的最大限度。如果要讓數據倉庫提供對歷史記錄進行決策查詢的功能,就必須支持對大量數據的管理。數據的規模不僅直接影響決策查詢的時間,而且還將直接影響企業決策的質量。
在數據倉庫的開發目標中,還有:根據用戶對數據倉庫的基本需求,確定數據倉庫中數據的含義;確定數據倉庫內容的質量,以確定使用、分析和建議的可信級別;哪種類型的數據倉庫可以滿足最終用戶的需求,這些數據倉庫應該具有怎樣的功能;需要哪些元數據,如何使用數據源中的數據等。 數據倉庫的開發目標多種多樣,十分復雜,需要開發人員和用戶在開發與使用的過程中不斷交互完善。因此,在規劃中需要確定數據倉庫的開發范圍。使開發人員能夠根據需求和目標的重要性逐步進行,並且在開發中吸取經驗教訓,為數據倉庫在企業中的全部實現提供技術准備。因此,在為數據倉庫確定總體開發方向和目標以後,就必須確定一個有限的能夠很快體現數據倉庫效益的使用范圍。在考慮數據倉庫苦的應用范圍時,主要從使用部門的數量和類型、數據源的數量、企業模型的子集、預算分配以及開發項目所需的時間等角度分析。
在分析這些因素時,可從用戶的角度和技術的角度兩方面進行。 從用戶的角度應該分析哪些部門最先使用數據倉庫?是哪些人員為了什麼目的使用數據倉庫?以及數據倉庫首先要滿足哪些決策查詢?因為這些決策查詢往往確定了關於數據維數、報表的種類,這些因素都將確定數據倉庫定義時所需要的數量關系。查詢的格式越具體,越容易提供數據倉庫的維數、聚集和概括的規劃說明。 從技術角度分析,應該確定數據倉庫中元資料庫的規模,數據倉庫的元資料庫是存儲數據倉庫中數據定義的模型。數據定義存儲在倉庫管理器的目錄中,可以作為所有查詢和報表工具構造和查詢數據倉庫的依據。元資料庫的規模直接表示了數據倉庫中必須管理的數據規模。通過對元資料庫規模的管理,實際上就確定了數據倉庫中所需要管理的數據規模。
3、數據倉庫的結構選擇
數據倉庫的結構可以進行靈活的選擇,可將組織所使用的各種平台進行恰當的分割,把數據源、數據倉庫和最終用戶使用的工作站分割開來進行恰當的設計。
(1)數據倉庫的應用結構
基於業務處理系統的數據倉庫 在這種結構中,將運作的數據用於無需修改數據的只讀應用程序中。具有這種結構的數據倉庫元資料庫是一種虛庫,而不是數據倉庫自身的元數據。在數據倉庫元資料庫的直接指導下,對數據倉庫的查詢就是簡單的從資料庫中抽取數據。
單純數據倉庫
利用在數據倉庫中的數據源凈化、集成、概括和集成等操作,將數據源從業務處理系統中傳輸進集中的數據倉庫,各部門的數據倉庫應用只在數據倉庫中進行。這種結構經常發生在多部門、少用戶使用數據倉庫的情況下。這里的集中僅僅是邏輯上的,物理上可能是分散的。
單純數據集市
數據集市是指在部門中使用的數據倉庫,因為企業中的各個職能部門都有自己的特殊需要,而統一的數據倉庫可能不能滿足這些部門的特殊要求。這種體系結構經常發生在個別部門對數據倉庫的應用感興趣,而組織中其他部門卻對數據倉庫的應用十分冷漠之時,由熱心的部門單獨開發式所採用。
數據倉庫和數據集市
企業各部門擁有滿足自己需要的數據集市,其數據從企業數據倉庫中獲取,而數據倉庫從企業各種數據源中收集和分配。這種體系結構是一種較為完善的數據倉庫體系結構,往往發生在組織整體對數據倉庫應用感興趣之時所採用的體系結構。
(2)數據倉庫的技術平台結構 單層結構
單層結構主要是在數據源和數據倉庫之間共享平台,或者讓數據源、數據倉庫、數據集市與最終用戶工作站使用同一個平台。共享一個平台可以降低數據抽取和數據轉換的復雜性,但是共享平台在應用中可能遇到性能和管理方面的問題,這種體系結構一般在數據倉庫規模較小,而組織的業務系統平台具有較大潛力之時所採用。
客戶/伺服器兩層結構
一層為客戶機,一層為伺服器,最終用戶訪問工具在客戶層上運行,而數據源、數據倉庫和數據集市位於伺服器上,該技術機構一般用於普通規模的數據倉庫。
三層客戶/伺服器結構
基於工作站的客戶層、基於伺服器的中間層和基於主機的第三層。主機層負責管理數據源和可選的源數據轉換;伺服器運行數據倉庫和數據集市軟體,並且存儲倉庫的數據;客戶工作站運行查詢和報表運用程序,且還可以存儲從數據集市或數據倉庫卸載的局部數據。在數據倉庫稍具規模,兩層數據倉庫結構已經不能滿足客戶的需求,要講數據倉庫的數據存儲管理、數據倉庫的應用處理和客戶端應用分開之時,可以採用這種結構。
多層式結構
這是在三層機構基礎上發展起來的數據倉庫結構,在該結構中從最內數據層到最外層的客戶層依次是:單獨的數據倉庫存儲層、對數據倉庫和數據集市進行管理的數據倉庫服務層、進行數據倉庫查詢處理的查詢服務層、完成數據倉庫應用處理的應用服務層和面向最終用戶的客戶層。體系層次可能多達五層,這種體系結構一般用於超規模數據倉庫系統。
4、數據倉庫使用方案和項目規劃預算
數據倉庫的實際使用方案與開發預算,是數據倉庫規劃中最後需要確定的問題。因為數據倉庫主要用於對企業管理人員的決策支持,確保其實用性是十分重要的,因此需要讓最終用戶參與數據倉庫的功能設計。這種參與是通過用戶的實際使用方案進行的,使用方案是一個非常重要的需求模型。實際使用方案必須有助於闡明最終用戶對數據倉庫的要求,這些要求有的只使用適當的數據源就可以得到基本滿足,而有的卻需要來自企業外部的數據源,這就需要通過使用方案將這些不同的要求聯系起來。 實際使用方案還可以將最終用戶的決策支持要求與數據倉庫的技術要求聯系起來。因為當用戶確定最終要求後,為元資料庫的范圍確定一個界限。還可以確定所需要的歷史信息的數量,當根據特定的用戶進行數據倉庫的規劃時,就可確定最終用戶所關心的維度(時間、方位、商業單位和生產企業),因為維度與所需要的概括操作有明顯的關系,必須選擇對最終用戶有實際意義的維度,如:「月」、「季度」、「年」等。最後,還可以確定數據集市/數據倉庫的結構需要,使設計人員確定採用單純數據倉庫結構,還是單純的數據集市結構或者是兩者相結合的結構。
在實際使用開發方案確定後,還需要對開發方案的預算進行估計,確定項目的投資數額。投資方案的確定可以依據以往的軟體開發成本,但是這種預算的評估比較粗糙。另一種方法是參照結構進行成本評估,也就是說,將數據倉庫實際使用方案所確定的構件進行分解,根據各個構件的成本進行預算估算。數據倉庫的構件包含在數據源、數據倉庫、數據集市、最終用戶存取、數據管理、元數據管理、傳輸基礎等部分中,這些構件有的在企業原有信息系統中已經具備,有的可以選擇商品化構件,有的則需要自我開發。根據這些構件的不同來源,可以確定比較准確的預算。 在完成數據倉庫規劃後,就需要編制數據倉庫開發說明書,說明系統與企業戰略目標的關系,以及系統與企業急需處理的范圍相對有限的開發機會,所設想的業務機會的說明以及目標任務概況說明、重點支持的職能部門和今後工作的建議。數據倉庫項目應有明確的業務價值計劃開始,在計劃中需要闡明期望取得的有形和無形的利益。無形利益包含利用數據倉庫使決策完成得更快更好等利益。
業務價值計劃最好由目標業務主管來完成,因為數據倉庫是用戶驅動的,應該讓用戶積極參與數據倉庫的建設,在規劃書中要確定數據倉庫開發目標的實現范圍、體系結構和使用方案及開發預算。
㈦ 圖像資料庫的簡介
圖像資料庫是遙感圖像的數據集合。遙感圖像包含多譜段組成的圖像數據,數據量龐大。圖像數據是圖像像元灰度值的記錄,以行列數據矩陣表示。圖像資料庫由兩個層次數據集合構成。第一層次為圖像數據詞典。數據內容包括對圖像總體特徵的描述,如波段、行數、列數、精度、記錄格式、最大值、最小值、成像日期等;第二層次為圖像基礎數據,根據第一層次數據內容所提供的有關信息,可直接進入基礎數據集合,進行檢索、處理操作。
㈧ 省域控制點圖形圖像資料庫的構建
管相榮
(河南省國土資源廳信息中心 鄭州 450016)
摘 要:為了滿足大區域控制點綜合管理時針對多領域的需求,實現數據的共享所面臨的坐標系統、屬性結構、投影帶、行政轄區、影像重疊區等問題,採用省域控制點圖形圖像資料庫建立的案例分析,省域控制點圖形圖像資料庫存儲了控制點的屬性、空間位置、圖形圖像等多項信息,疊合了行政轄區、原始影像、接合圖表、投影帶等信息,為第二次全國土地調查工作的開展提供了寶貴的資料和經驗。
關鍵詞:省域 控制點 GPS 控制點圖形圖像資料庫
0 引 言
為確保「2010 年全國耕地面積不少於 18 億畝(1.2 億 hm2)的紅線」,國家已經啟動第二次全國土地調查,利用先進的技術和方法,力求建立「四級聯動、上下互通」、「高保真」的土地利用資料庫,實現土地管理的信息化、網路化。河南省作為全國人口和農業大省,土地總面積約16.7 萬 km2,2007 年人均耕地面積 813.4 m2,低於全國平均水平,在國家嚴控耕地面積的嚴峻形勢下,如何摸清土地家底、有效集約管理土地資源尤為重要。近年來,河南省運用先進的「3S」技術和通信技術,已經開展了多項土地資源監測、地籍調查方面的研究。全國高解析度影像數據處理及資料庫建設項目(以下簡稱「遙感項目」)是第二次全國土地調查的先導,旨在為其提供寶貴的經驗。河南省作為項目試點之一,2005 年以 GPS 實測點為控制數據,影像數據均採用SPOT 5 遙感影像,對平頂山、許昌、漯河、安陽四個地市的遙感影像進行處理,精度滿足要求。2007 年項目在全省鋪開,布設控制點數達上千個,按照《SPOT 5_2.5 m 數字正射影像圖製作技術規定》及《第二次全國土地調查底圖生產技術規定》的要求,對影像處理必須精確,影像糾正控制點是土地信息提取的關鍵所在,如何綜合管理這些控制點數據十分必要;同時,就我國 GPS控制網而言,GPS A B C 級點布設達上萬個,而以此為基準的下一級 GPS 控制點將更多,對其進行分板機統籌管理也勢在必行。
影像糾正控制點的獲取途徑有兩種:一種是 GPS 實測,另一種是從大於等於調查底圖比例尺的已有圖件上採集。遙感項目河南試點控制數據均為 GPS 實測點,省域控制點管理包括 GPS 實測點和圖形圖像控制點,涉及跨省域、投影帶、屬性結構設定、編號、疊加分析、條件查詢、圖形查詢、精度評定、點位分布聯測略圖等問題,有必要根據實際的工作底圖情況,建立控制點圖形圖像資料庫,實現控制點位置信息、屬性信息、圖形圖像信息的統一管理,力圖為同類研究提供參考。
1 控制點基礎信息獲取
1.1 控制點的布設與測量
項目控制點布設的工作底圖是 SPOT 5_2.5 m 遙感影像,河南省域涉及 80 多景 SPOT 5 影像,受衛星數據獲取周期的影響,影像是分批次提供的,為保證項目進度,控制點的布設採用先來先選的原則分批次進行。選取要求有:
(1)選取影像清晰、易於判別、交通便利的明顯特徵點,如影像特徵明顯的農村道路交叉路口,並讀取概略經緯度;
(2)均勻分布,控制區域大於工作區范圍,每景控制點數不少於 25 個,山區適當增加;
(3)邊緣選點,相鄰影像重疊區不少於 2 個同名公共點;
(4)模糊定位、圈定范圍,為便於精確定位點的靈活性,採用 800 像素 ×800 像素的正方形選框,外業測量時可以在此選框內靈活定點,一般要求選框中間點位優先選用;
(5)內業選點難以測量時,可適當在該點附近重新選點,外業要作詳細記錄。
項目區覆蓋多景影像,為的是選點均勻,公共點布局合理,在選取某景影像控制點時應同時參照相鄰景,單景保證四角有點,其間三角形布點。控制點編號採用××××××_××××××_××,第一個「_」前為控制點所在景號,第一、第二個「_」之間為控制點所在影像的時相,共 6 位,採用年月日格式,第二個「_」後為控制點所在影像內序號,如 273280_061101_10, 表示景號為 273280、時相為 2006 年 11 月 1 日的影像上的第 10 個控制點,另外在測量成果表中增加測量編號和標准編號,測量編號是控制點布設實時編號,對應外業測量表中的序號,標准編號則按 1∶1 萬標准圖幅為基準,自上而下、自左而右的編號,如I49G030050, 以求更好地管理和應用控制點基礎資料,為此我們設計了控制點測量成果表。
考慮到項目區山區、丘陵、平原均有分布,不同地形都選取檢查點,在布點時類同控制點選取,只是在影像正射糾正時根據參與運算與否才設定其是控制點或是檢查點。三種地形特徵檢查點可以從不同地形下分析控制點精度,對於布點較為困難的山區,可以打破單景的局限,採用區域布點檢查法。
以國家 C 級 GPS 大地控制點為基準,採用靜態方式同步進行觀測,3 套 GPS 接收機為一組,觀測時段長度為 45 min,衛星高度角≥ 15°,有效衛星總數≥ 4 個,作業員現場填寫外業測量記錄表,測隊隊員定時進行業內匯合,整個省域全部控制點測量耗時近 1 年,共完成 1454 個控制點的測量。
項目共布設 13 個測區,外業實地測量均採用環形布點形成一個整體的 GPS 控制網,各測區以不同的顏色表示,控制點間平均距離約 13 km,點位序號是項目區需要測量的糾正控制點測量編號,不足 4 位的前加「P」表示,前面加「C」的點則表示已有的 C 級 GPS 控制點。
1.2 控制點坐標及投影帶的設置
控制點有 4 套坐標系統:西安 1980 坐標、北京 1954 坐標、WGS84 坐標、概略經緯度及高程。
項目採用高斯-克呂格投影 3 度分帶、1985 國家高程基準、北京 1954 坐標系。河南省域跨越 37、38、39 帶,測量的坐標數據存在 3 套數據,通常構建資料庫時坐標系統的中央經線為114°,即 38 帶。為確保整個省域建庫數據為統一的坐標系統,就應把 37 帶、39 帶內的控制點進行換算,一般採用高斯投影、反算公式間接換帶計算。現在把 37 帶、39 帶的控制點坐標換算成 38 帶,見表 1。實測測量時,可通過儀器設置或基於坐標換帶公式原理開發的專用軟體換算。
表1 GPS 控制點 3 度分帶相鄰帶坐標換算對應表(河南省)
續表
1.3 屬性結構設定
為便於管理控制點圖形圖像資料庫,並為後續國土研究提供基礎資料,因此盡可能詳述控制點的屬性信息。表 2 是設定的控制點庫表結構。
表2 控制點文件屬性結構一覽表
屬性結構設定的特色:
(1)3 套編號系統(標准編號、景內編號、測量編號)。標准編號是所有 GPS 實測控制點選取完畢後,為便於管理,以 1∶1 萬標准圖幅為底圖採用「自上而下、自左而右」原則重新編號,命名採用「1∶1 萬標准圖幅號 _ 圖幅內序號」;景內編號則是就單景而言,景號 _ 時相 _ 景內序號命名;測量編號則是在項目實施中實際工作選點編號,作為控制點成果表整理及入庫的依據。
(2) 4 套坐標數據(北京 1954 坐標、西安 1980 坐標、WGS84、概略經緯度)。概略經緯度可以對控制點在實地測量前進行模糊定位,此外也為了後期插敘的需要,例如,對一景現實性影像,通過幅寬經緯度可查詢到其間大致所覆蓋的控制點信息,減少了選點、測點等重復性工作。
(3)掛接點位影像、圖形及實地信息。控制點影像庫不僅有點的屬性描述,也有點點陣圖形和實測信息,使控制點信息更加豐富。
(4)與權屬庫、接合圖表、影像范圍圖疊合,便於查看控制點的區域型分布、與影像及圖幅間的關系。
1.4 與遙感影像的套合
控制點是遙感影像定位的基本參照信息,已知工作區的 DEM 和影像控制點坐標信息,就可以對影像進行幾何糾正和投影差改正,製作數字正射影像圖(DOM),提取土地利用現狀信息,構建土地利用資料庫,此亦第二次全國土地調查的前期業內工作。通常,我們是先在原始影像上布設控制點,測量其坐標信息,然後影像處理,即影像選取點、點定位影像的工作模式。但建立河南省控制點圖形圖像資料庫後,對省域內任意工作區的影像,即沒有投影和平面坐標信息的現時性影像,可以通過影像頭文件找其所包含的控制點信息,避免了重復選點、測點。
控制點影像數據與遙感影像的套合、疊加查詢分析,需要兩者間存在恆定的某種信息。控制點是地球上的固定點,SPOT 5 遙感影像的頭文件里顯示影像獲取時間及影像的經緯度坐標(大地坐標),為避免大地坐標與高斯平面坐標轉換時的誤差影響影像處理精度,目前只能通過兩者的經緯度坐標,對影像包括的控制點信息進行模糊查詢,然後再准確定位點。在 MapGIS 平台中,可以通過影像的經緯度坐標將其范圍框直接定位到控制點圖形圖像資料庫的平面坐標工程上,很直觀地查看三者間的關系,如圖 1 所示。
圖1 控制點、影像、行政區空間關系圖
2 控制點圖形圖像資料庫構建
經過「布點、測點」後,在 ERDAS 軟體的 LPS 模塊里對控制點進行嚴格的精度檢查,只有滿足精度要求後才可入庫,具體流程如圖 2 所示。同時設定了資料庫文件的組織(表 3)。基於上述資料庫建設思路,在 MapGIS 平台上構建了控制點圖形圖像資料庫,如圖 3 所示。
圖2 GPS 控制點圖形圖像資料庫建庫流程
圖3 河南省 GPS 控制點圖形圖像資料庫
表3 GPS 控制點圖形圖像資料庫文件
3 結 論
控制點作為基礎地理數據,其重要性不言而喻,河南省域共布設 1000 多個實測控制點,歷時近 1 年,耗費了相當的人力物力,控制點圖形圖像資料庫的建立旨在實現信息共享,避免資源浪費,為國土及其他領域的研究提供了寶貴的基礎資料,尤其是在第二次全國土地調查河南工作區,控制點圖形圖像資料庫對調查底圖製作起到了十分重要的作用。另外,省域型控制點圖形圖像的建立也為大區域多數量控制點數據的綜合管理提供了點滴參照。當然也有未涉及的內容,如不同等級控制點的管理、控制點的三維布局再現等。
參 考 文 獻
GB/T 18314—200《1全球定位系統(GPS)測量規范》[S]
蘇小霞,李英成.2006.全國多級多解析度圖形圖像控制點資料庫的建立與應用展望[J]. 遙感技術與應用,21(3):265~230
王之卓.1990.攝影測量原理(英文版)[M]. 武漢:武漢測繪科技大學出版社
曾福年,趙翠玲.2006.圖像控制點庫的建立及應用方法探討[C].2006 年中國土地學會學術年會論文集
張繼賢,馬瑞金.2000.圖形圖像控制點庫及應用[J]. 測繪通報(1):15~17
(原載《鄭州大學學報(工學版)》2008 年第 2 期)