基于关系的空间信息处理是对基于几何的空间信息处理方式的一种有益补充,是地理信息科学、语言学、认知科学和人工智能等学科交叉的重要理论之一,在图像智能解译、空间数据挖掘、多源空间数据集成和空间场景知识表示等高级和智能化空间信息处理领域具有重要应用。《多尺度空间关系理论与实践》简要介绍空间信息几何表现和关系表现与空间尺度的关系,重点阐述多尺度空间关系建模理论与应用,主要包括作者在拓扑关系多尺度建模理论、方向关系多尺度建模理论、定性位置多尺度建模理论与相似性问题,以及基于关系的多尺度数据分析的总体框架、多尺度数据查询、多尺度数据一致性检测应用等方面的研究成果。
《多尺度空间关系理论与实践》可作为从事遥感与地理信息科学研究和应用的科技人员参考书,也可作为高校测绘、地理信息科学、遥感、计算机科学等相关专业的师生教学用书。
第1章空间信息表现与空间尺度
空间信息多尺度表示与处理是当今地理信息科学领域理论与方法研究的重要前沿,主要解决由于不同部门用户对地理数据的不同应用需求和分析需要,而导致空间数据的不同表示问题。多尺度、多类型、多时态的空间数据是人类研究和解决人口、资源与环境等重大问题时所必需的重要信息资源,是“数字奥运”“智慧城市”“智能交通”等应用的重要数据基础设施。
空间信息服务已成为空间信息技术社会化、实用化的核心问题,其典型代表是以Google Earth为代表的多尺度空间数据网络服务、多尺度电子地图自适应可视化等平台。空间信息服务的主要问题有:①不同行业领域对空间数据详细程度的需求不一样,如何为用户提供多种尺度或多种详细程度的空间数据?②如何统一管理多种尺度或多种详细程度的数据?③如何保证不同部门或行业生产的多尺度空间数据的一致性?④如何在多个尺度上查询和分析不同详细程度的空间数据?第一个问题是多尺度空间数据的生产问题,第二个问题是多尺度数据建模和管理的问题;第三个问题是多尺度数据的一致性问题;第四个问题是多尺度数据查询、信息提取和匹配分析问题。这四个问题构成了多尺度数据的生产、管理、分析和应用等各个阶段。到目前为止,针对前两个问题已有较多研究和相关应用软件,本书主要解决第三个和第四个问题。
1.1空间信息表现方式
空间信息表现方式是空间信息科学的基础,主要涉及如何把地理世界中各种地理要素的几何、属性,以及空间关系等重要信息经过认知、加工和抽象后,科学地加以组织和表达,以利于空间信息分析处理。常用表现方式有两类:面向计算机的几何表现及面向认知的关系表现。
1.1.1表现方式
如图1.1所示,空间信息可从两个方面进行表示。一方面,为有利于计算机精确表现地理世界,必须先定义坐标系统,然后基于坐标系表达地理要素的几何位置,采用高效的几何数据结构进行存储和管理。这种表现方式侧重地理要素的几何位置、几何形态和几何分布的表示,因此称为几何表现方式。另一方面,人类基于自己对地理世界的认知和理解,对地理要素的空间关系进行认知和抽象,用一些关系符号表达,并进行交流和推理。这种表现方式侧重地理要素关系表达,并对每种关系赋予一个词汇或符号表示,因此称为关系表现方式。
(a)几何表现(b)关系表现图1.1空间信息表现方式
如图1.1所示,几何表现把地理场景抽象为由面对象a、b(由b1、b2和b3组成)和c,以及线对象d组成的对象稽核,并完整记录了每个对象的几何坐标位置。几何分析可以对象几何位置进一步进行面积、长度量算,以及分布模式推导等。关系表现则把对象间的空间关系表示为一些自然语句的集合,方便人类理解,如“d穿越a,d从b1和b2间穿过,b3和c位于d的北方,c位于b的东和东北”等。“穿越”“穿过”“北方”和“东北”等就是空间关系符号表示。
几何表现和关系表现都是对地理世界的客观表示,但由于出发点不同,因此差异明显。几何表现重在空间信息的精确表达、管理和几何分析,因此必须严格定义空间坐标系统,并基于坐标系统进行描述和分析,但与人类的认知不符。关系表现重在关系概念的认知和表达,因此由定性符号系统及相关运算组成。关系表现不是一种精确表达方式,但人类有足够的能力进行推理、理解和交流关系符号所表达的空间信息。
尽管几何表现和关系表现间差异明显,但它们都是重要的空间信息表现和处理方式,互为补充。高层次的空间分析和理解不仅需要几何信息,更需要关系知识。例如,制图综合中,形状化简前后的数据需要保持拓扑一致性。因此,需要在几何表现和关系表现间建立联系。空间关系模型能根据对象类型,把几何数据转化为关系表示。不同的关系模型可以把相同的几何数据转换为不同的关系符号,并进行关系推理运算。
1.1.2几何表现
为表达地理世界,几何表现首先定义了空间坐标系统,然后把地理对象表示为空间坐标系统中点的集合。由于每个点都具有坐标,因此可测量面积、长度等定量几何信息。对于多源数据,只要具有相同的坐标系统,就可进行集成、融合、匹配、管理和分析。
(1)空间坐标系统。GIS坐标系统是笛卡儿坐标系,由一个原点和垂直的坐标轴组成。GIS中常用坐标系主要包括平面直角坐标、地理坐标系等。地球椭球面上任一点的位置,可由该点的纬度(B)和经度(L)确定,即地面点的地理坐标值,由经线和纬线构成两组互相正交的曲线坐标网称为地理坐标网。由经纬度构成的地理坐标系统又称为地理坐标系。根据地图投影方法,可把地理坐标系转为平面直角坐标系。
(2)空间数据模型。简单地讲,空间对象为点的集合。但由于地理要素和地理应用的复杂性,不同要素、不同应用需要不同的模型表达对象。通常可分为矢量模型和栅格模型。矢量模型是一种基于对象的表达方式,完整准确表达了每个对象的几何位置、形状和形态特征。栅格模型是一种基于像元的表达方式,用具有一定大小的像元近似表示空间对象,每个像元可具有属性。影像是一种常用的栅格数据,每个像元用光谱表达地物的信息。由于影像没有显式表达每个对象及其属性,因此需要对影像数据进行分析理解,转化为基于对象的表示。
(3)空间数据管理。几何表现将空间场景表示为对象(点、线、面)的集合,并采用空间索引技术(格网索引、四叉树索引、R树等)对空间对象进行高效组织,以帮助管理和快速查询。在此基础上,对每个对象进行符号显示和制图,或者进行三维场景虚拟显示。无论是空间数据索引或可视化,都是在空间坐标系统支持下,以空间对象的几何坐标、位置、形态为基础的。
(4)空间几何分析。几何表现把空间对象表示为点、线、面以及三维实体等基本结构。基于这些对象结构,可分析对象的基本信息,如空间位置(基于空间坐标系传递空间对象的定位信息)、空间分布(同类空间对象的群体分布信息,包括分布、趋势、对比等)、空间形态(空间对象的几何形态)和空间距离(空间对象的接近程度)。把空间对象的几何数据和属性数据结合,可进行几何分析和量算,如缓冲区分析、叠加分析、网络分析等,再从空间数据中提取有用信息。
1.1.3关系表现
关系表现首先基于空间关系模型,把几何表现中的坐标数据转化到概念空间中的关系语言,然后基于关系语言进行关系知识的表达、管理、推理及场景分析。
(1)空间关系定位。计算机是基于笛卡儿坐标系进行对象定位的,而人类是基于关系进行对象定位的。例如,维基百科把太行山位置描述为“跨越北京市、河北省、山西省、河南省4省(市);北起北京西山,南达豫北黄河北崖,西接山西高原,东临华北平原”。基于关系的定位把目标对象(太行山)和参照对象(用地名表示)通过空间关系关联来进行定位。这种定位方式显然没有笛卡儿坐标系准确,但人们更习惯用基于关系的位置表达。
(2)空间关系模型。人类对关系的表达和抽象是自动进行的,为使计算机也具备空间关系处理能力,必须在几何表现和关系表现间进行转换。空间关系模型是一种数学模型,根据空间对象的几何特征,从对象的几何表现获得它们的关系符号描述。其中,空间对象间存在多种类型空间关系,包括:拓扑关系、方向关系、邻近关系、距离关系等。针对不同类型关系,有不同的空间关系描述模型,如拓扑关系的九交模型和方向关系的方向关系矩阵模型等。
(3)空间关系管理。关系表现将空间场景仍然看做对象集合,用一个关系网络来表达。在关系网络中,对象是没有大小和长度的,只是表示为网络的节点;而对象关系表示为节点间边的属性。因此,关系网络可管理和表达空间场景中所有对象的关系知识。基于关系网络,可进行空间推理、场景一致性和相似性分析等工作。
(4)空间关系分析。空间关系是定性概念,因此不能进行量化分析。距离是分析的基础,关系间的距离是通过概念间的定性距离来度量的。不同类型对象(如线/线、线/面、面/面)、不同类型关系(如拓扑关系、方向关系)可用不同概念邻居图来表达任意两个关系的距离。基于两个关系的距离,可定义和度量两个关系网络的相似性,从而进行场景相似性分析。
表1.1总结和比较了几何表现和关系表现的特点。
表1.1几何表现和关系表现
几何表现关系表现
定位方式 笛卡儿坐标系 基于关系的定位
定位性质 绝对定位 相对定位
定位精度 量化、精确 定性、近似
对象表现 几何表现(点、线、面等 ) 关系知识表达、推理
空间分析 几何计算、欧式距离等 概念距离、关系距离、场景相似
信息度量 定量处理(面积、长度 ) 定性概念表达
1.2几何表现与空间尺度
地理世界中的各种地理现象和过程都可经过人类认知、抽象和建模,表达为空间几何数据和属性数据。地理信息系统主要用于存储、检索、操作、查询和分析空间几何数据(如点、线、面、空间划分和网络等),以及属性数据,为空间问题或地理问题解决和决策提供服务。几何表现提供了基本的数据类型来抽象和表达地理现象的几何结构、关系、属性,以及相关操作。因此,基本数据类型的定义对空间数据表达和管理非常重要。
但由于地理世界的复杂性、人类认知能力的有限性,以及分析应用需求的多样性,同一地理现象需要在不同尺度上进行抽象和表达。度量或观测的空间尺度在很大程度上决定了哪些现象和过程要表达、如何表达,以及哪些现象要舍弃的问题。因此,GIS或空间数据库包含了地理现象在一定和有限尺度上的表达。为在多个尺度上创建、管理、制图和发布地理现象的几何表达,这就需要管理空间对象的多尺度表现。
1.2.1几何表现模型
从对象建模的角度看,主要有两种模型:基于对象的(entity-oriented / feature-based view)和基于场的模型(space-oriented / field-based view)。基于对象的模型主要建模和表达位置或范围明确的地理要素,它们在空间上占据一定范围,并且是离散的 (如道路、建筑物等)。基于对象的模型主要由三个要素组成:①空间位置;②非空间属性 (如名称、类型等);③运算 (如对于道路而言,其操作运算有确定道路中心线、确定道路长度等 )。空间对象一般指地理对象的空间属性,在GIS和空间数据库中也称为空间数据类型。
空间对象有单个对象类型和集合类型之分。
(1)简单点对象
(图 1.2(a)),用坐标系中的一个点表示,主要建模和表达对象在空间的位置,而不表达对象的范围 (如水井、电线杆、城市等 )。
(2)简单线对象
(图 1.2(b)),用一系列坐标串表示,不能自相交,且只有 2个端点。主要表达对象在空间上的连通性,或者对象在空间上的运动 (如河流、道路、电力线、路径等)。
(3)简单面对象
(图 1.2(c)),指由首尾相同的一系列坐标串围成的封闭区域,主要表达对象的空间范围 (如湖泊、城市、林地、农地等 )。简单面对象是连通的,且不能包含岛屿。
(4)复杂点对象(图 1.2(d)),由多个点对象组成,表示一些复杂的对象。
(5)复杂线对象
(图 1.2(e)),用一系列坐标串表示,但允许自相交,端点个数可多于 2个。
(6)复杂面对象(图 1.2(f)),由多个简单面对象组成,因此可以不连通,或包含岛屿。
(7)空间划分集合类型(图 1.2(g)),主要指把平面空间划分为分离的面对象,每个面对象都有一个属性,且可表示为简单或复杂的几何类型。一般而言,划分类型中的每个元素不允许出现带岛屿的面对象。例如,每个国家的行政区域划分、土地利用分类图等。
(8)空间网络集合类型 (图 1.2(h)),主要指由离散对象及其网络连接关系组成的集合。例如,道路网络、水系网络等。
(a)简单点 (b)简单线 (c)简单面
(d)复杂点 (e)复杂线 (f)复杂面
(g)空间划分 (h)空间网络图 1.2空间数据类型
通常基于对象的模型用矢量数据结构实现,而基于场的模型主要建模和表达在空间上连续分布的地理要素 (如温度场、气压场 ),通常用栅格数据结构实现。
1.2.2 几何表现与空间尺度
多尺度数据建模和管理是多尺度应用的核心,也是当前 GIS领域研究的主要前沿问题。美国国家地理信息与分析中心 (NCGIA)从 1988年就开始关注并支持研究空间数据的多尺度表达问题 (Buttenfield,1995)。
……