• Cehui8.com 测绘地理信息领域专业门户
  • 首页 > 测绘论文 > GIS

    地理空间数据挖掘技术在果树生态区域选择中的应用

    2013-07-09 21:36:32 来源: 测绘论坛 作者:
    聊聊

    一、前言
    近年来,随着“数字空间区域”的建设和地理信息系统(Geography Information System,GIS)技术的快速发展,积累了大量与空间位置相关的基础地理空间数据,如数字线划图(DLG)、数字高程模型(DEM)、数字正射影像图(DOM)等数字产品。如何从如此海量的空间数据库中挖掘和派生出更有价值的信息,为科学研究和生产实践服务,成为当前空间数据挖掘技术研究的重要课题。
    二、数据挖掘
    2.1数据挖掘(Data Mining)
    又称为数据库中的知识发现(Knowledge Discovery in Database,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。数据挖掘是一个由数据库、人工智能、数理统计和可视化等多学科与技术交叉、渗透、融合形成的交叉学科。
    2.2地理空间数据挖掘(Geospatial Data Mining)
    地理空间数据挖掘是指从地理空间数据库中抽取隐含知识、空间关系或非显式存储在数据库中有意义的特征或模式,挖掘地理空间要素的空间特性,如地理位置、方位、距离、几何拓扑关系、空间属性等。该技术在理解空间数据、获取空间与非空间数据间的内在关系方面具有重要的实用意义。
    地理空间数据包括矢量和栅格两大类型。矢量数据(如DLG)包括地理空间数据和属性数据及相关的拓扑关系;栅格数据(如DOM、DEM)有规则网格(矩形及TIN格网)和离散网格两种数据集。
    2.3地理空间数据挖掘的几种典型方法
    (1)地理空间统计方法
    地理空间统计是指分析地理空间数据的统计方法,主要是利用了空间中邻近的要素通常比相距较远的要素具有较高的相似性这一原理。该模型可以分为三类:地统计、格网空间模型和空间点分步形态。如DEM、DOM的直方图、平均值、均方差、最大最小值统计等。
    (2)地理空间聚类方法
    地理空间数据聚类是按照某种距离度量准则,在大型、多维数据集中标识出聚类或稠密分布的区域,从而发现数据集的整体空间分步模式。该方法主要分为四类:分割法、层次法、基于密度的方法及基于网格的方法。如主导因素法、模糊聚类法。
    (3)地理空间关联分析
    地理空间关联分析是利用空间关联规则提取算法发现空间数据库中空间目标间的关联程度,从而进行空间数据关联分析的知识发现研究,其核心内容是挖掘空间关联规则。如最佳路径、最短路径分析;邻近分析、包含落入分析、缓冲区分析等;DEM的坡度、坡向、坡位分析、视域分析等。
    (4)地理空间分类与预测分析
    地理空间分类与预测是根据已知的分类模型把数据库中的数据映射到给定类别中,进行数据趋势预测分析的方法。人工神经网络可以作为该方法的典型技术应用于实际研究中。如影像的监督及非监督分类、专家分类法、基于知识的分类法、植被指数提取等。
    (5)异常值分析
    顾名思义,异常值分析即将数据库中与通常的行为或数据模型不一致的数据提取出来的分析方法。通过这种方法可以提取出数据库中的异常信息或噪声数据,有时也会导致隐藏的重要数据丢失。异常值分析方法主要有三种:基于统计的异常值分析、基于距离的异常值探测、基于偏差的异常值探测。
    三、地理空间数据挖掘与实际应用的结合点
    通过农业部门的研究,果树生长与阳光、空气、水分、土壤(肥料)等基本要素有着密不可分的关系。果树的生长环境又与地理纬度、海拔高度、生长季节有很大的关系,尤其是冬季冻害对果树的生长、开花、结果有很大的影响,而冬季冻害的分布与地理因子有很大的内在联系。
    数字高程模型(DEM)含有地理坐标(经度和纬度)和海拔高等地理信息,通过对DEM数据进行数据挖掘,采用地理空间关联分析法,提取与果树生长环境密切相关的信息,如坡度、坡向、坡位、果树生长地理纬度、离海洋的距离等地理因子。通过对农业气候生态及其地理分布特征的研究,结合历史气象资料、实地考察、现实种植等相关情况,进行GIS技术的空间叠置分析,实现果树种植生态区域选择和规划,指导果农进行名优果树种植。该应用具有很重要的科学意义和潜在的经济价值。
    四、应用实例
    福建地处东南沿海,范围在北纬23°30′~28°20′,东经115°50′~120°45′之间;面积约12万多平方公里,地势由西北向东南倾斜,属亚热带海洋性季风气候,年平均气温在-9.5℃~43.2℃之间,呈典型的温暖湿润气候特点,适合种植热带和亚热带果树。闽东南沿海是著名的水果之乡,盛产龙眼、荔枝、蜜柚等亚热带水果。由于地理位置的不同,闽东北沿海年平均气温比闽东南沿海年平均气温相对低2.8℃~3.5℃之间,但受海洋性温暖气候影响,个别区域也可种植晚熟的热带、亚热带水果(如龙眼、荔枝等)。
    通过与福建省农科院土肥所的合作,决定在福建省闽东北地区(福鼎—霞浦一带,北纬26°25′~27°26′之间)进行晚孰热带和亚热带果树(如龙眼、荔枝等)生态种植区域选择试验。
    本试验采用的基础地理空间数据包括全县范围的DLG和DEM数据。通过对DLG和DEM数据进行挖掘,提取符合条件的地理因子(见表1),并进行GIS空间叠置分析,选择出适宜种植晚孰热带和亚热带果树的生态区域。
    4.1筛选条件
    表1 区域选择条件
           指    标
    地理因子
    适    宜
    不 适 宜
    设  置  意  义

    坡    度(slope)
    slope <=25 
    slope >25 
    坡度大于25°易造成水分、土壤、肥料等流失,不适宜种植,故取25°以下。

    坡    向(Aspect)
    Aspect=东南、正南、西南向
    Aspect=西北、正北、东北向
    朝南方向阳光充足,更适合果树生长,防避冬季冻害。

    冻害指标(TD)
    (温度模型)
    TD >-2
    TD <=-2
    考虑地理纬度、离海距离等地理因素对当地平均气温的影响,从而影响果树的生长和冬季冻害

    坡位为相对高差50%-80%区域
    50%-80%
    0%-49%
    &81%-100%
    基于对果树冻害的考虑。山顶易受冷空气影响,形成冻害;山脚易沉积冷空气,形成冻害,因此取相对高差50%-80%部分(经验指标)。

    4.2 数据预处理
    (1)DEM数据预处理
    进行换带和投影变换,把21度带的数据投影转换为20度带的数据,以县级区域为单位,进行DEM数据拼接。根据需要,还需把DEM数据投影为以经纬度坐标存储的数据,用于数字温度模型计算。
    (2)DLG数据预处理
    ①坐标转换到同一坐标系,投影到同一度带,以县级区域为单位,进行DLG数据拼接。
    ②提取境界、主要道路及注记、主要水系及注记、村级以上居民地及注记、海岸线和主要岛屿及注记、其他注记等核心要素,用于生态区划专题图制作。
    (3)行政区划信息提取
    ①按代码提取境界(县界)、海岸线岛屿数据(可以舍弃面积较小的岛屿),合并为同一图层。
    ②数据按福鼎市和霞浦县分别构建拓扑面,每个面都必须有相应的属性信息。
    4.3坡度、坡向数据生成及符合条件区域信息提取
    (1)由DEM生成数字坡度图(DSM)
    根据要求提取坡度25度以下的图元,对像元属性进行重编码:坡度25度以下的区域,置pd=1;坡度25度以上为不适宜区域,置pd=0,生成数字坡度专题图层。对生成的栅格图自动进行矢量化,导出为ARC/INFO的Coverage格式,并重建拓扑关系。
    (2)由DEM生成数字坡向图(DSA)
    根据要求提取正南、东南、西南坡向的像元,并进行重编码朝南向置px=1;朝西北、正北、东北向置px=0,生成数字坡度专题图层。对生成的栅格图自动进行矢量化,导出的格式为ARC/INFO的 coverage格式,并重建拓扑关系。
    4.4数字温度模型计算及避冻区域图层
    (1)冻害模型计算公式
    根据地理纬度和海洋季风气候的特点,对历史气象资料进行统计分析,由福建省气象局专家给出20年一遇的冻害(TD)计算公式。TD的计算公式如下:
    陆地(指内陆部分)
    TD(1/20)=38.2915-1.288224×Φ-1.895327×ln(H+30)+3.676606/(S+1)
    内岛(指海湾、河流入海口所包含的岛屿)
    TD(1/20)=38.2915-1.288224×Φ-1.895327×ln(H+30)+3.676606/(0.9+S/50)
    外岛(指远离陆地、相对独立的、周围被海洋所包围的岛屿)
    TD(1/20)=38.2915-1.288224×Φ-1.895327×ln(H+30)+3.676606/(0.8+S/50)
    以上公式中
    Φ为纬度,以度为单位;
    H为地面高程(海拔高),以米为单位,该数据可以从DEM数据中读取;
    S为格网点离海岸线的最近距离,以公里为单位;
    生成的数字气温模型的格网间距Dgrid为25米。
    (2)数字温度模型生成的方法
    ①Φ值从以经纬度坐标的DEM数据中读取;
    ②H值从DEM数据中读取;
    ③离海距S的计算:


    把海岸线数据(高斯投影坐标)离散化,把格网点的经纬度坐标转换成高斯投影坐标,计算每个格网点与海岸离散化点的距离,取S的最小值为离海距(离散化点间隔较小)。
    ④实现方法
    在VC++中根据公式编程计算TD值,其存储格式与原DEM相同,格式同为栅格数据,格网间距为25米。在此过程中涉及大量的计算,因此必须选用性能较好的计算机。
    冻害计算流程图(见图1)

    (3)避冻区域图层生成
    ①适宜区域的判别规则(见表2)
    表2:冻害等级评价表
    冻害等级
    无冻
    轻冻
    重冻
    重冻
    严重冻

    TD
    0<TD
    -2<TD≤0
    -3<TD≤-2
    -4<TD≤-3
    TD≤-4

    栽培区
    最适宜
    适宜
    次适宜
    可能种植
    不适宜


    ②根据以上判别表对TD模型数据进行重编码,TD>-2为适宜区域,置TD=1;TD<=-2为不适宜区域,置TD=0。对生成的栅格数据进行自动进行矢量化,导出的格式为ARC/INFO的 coverage格式,并重新构建拓扑面,生成避冻区域专题图层。

    (4)50%~80%坡位区域专题信息提取

    ①方法一:由DEM自动生成等高线,人工选取相对高差50%~80%区域。

    ②方法二:在DEM模型上人工交互选取相对高差50%~80%区域。

    ③方法三:利用现有的DLG数据,人工选取相对高差50%~80%区域

    ④对选取的区域构建拓扑关系,并设置适宜区域的属性代码CODE5-8=1,数据导出为ARC/INFO 导入为coverage格式,生成相对高差50%~80%适宜区域图层。

    (5)空间叠置分析

    ①在ARC/INFO进行交叉(intersect)叠置分析。只能两个图层进行交叉叠置分析。先对坡度、坡向图层进行交叉叠置,结果再与区域矢量专题图层进行交叉叠置,最终生成地理因子图层。对地理因子图层进行信息提取,提取符合条件(选取条件为:PX=1并且PD=1)的在所属境界内的地理因子专题信息。

    同样地,用intersect命令对以上步骤生成的地理因子图层、避冻区划图层、相对高差50%~80%适宜区域图层,在ARC/INFO进行交叉叠置分析。然后,在ARC/INFO对图层进行重新选择RESELECT提取符合条件的专题区域图层,提取条件为:PD=1&PD=1&CODE0.5-0.8=1&TD=1,符合以上4个条件的为最终适宜区域。

    ②在ARC/INFO对选择区域图层面积太小的图元进行取舍合并(eliminate,条件表达式RES AREA<=1250,即面积小于1250平方米的面元),生成最终成果专题图层。

    (6)选择区域专题图制作

    ①在ErDAS把数字高程模型数据进行彩色晕渲,制作彩色地势专题栅格图。

    ②在AutoCAD,插入彩色地势专题栅格图,叠加主要的水系、交通、居民地、注记等专题信息,以及适宜区域最终成果(区域按斜格网线填充),制作成专题图。

    ③在ArcView对最终适宜区域图层按县进行晚孰水果生态区域面积统计。

    4.5分析结果与现状对比验证

    (1)分析结果分布特点

    ①适宜区域呈沿海岸线分布。这是因为离海距离的影响,表明海洋气候对气温及冬季冻害的影响很大。

    ②适宜区域呈半山腰坡位分布。受相对高差50%~80%条件的影响很大,加上此条件则适宜区域大大减少,平原地几乎没有适宜区域。

    (2)种植现状验证分析

    选择区域的结果与福建霞浦、福鼎两地的种植现状(由农科院提供)进行对比,发现霞浦的沙江镇、福鼎的秦屿镇、白琳镇现有种植较大面积的荔枝和龙眼,大部分分布于平原地及朝南向山坡地,但平原地种植面积较山坡地大,这与忽略相对高差50%~80%条件所分析的结果较一致。但根据农科院的专家给出的经验而言,必须考虑冷空气在山地的坡位冻害影响,就专家经验而言,冷空气较易沉降在平原地,平原地受到的冻害较山坡地厉害。根据分析的结果,对当地的果农进行生产种植指导。

    五、结论

    由于我们经过近几年的基础测绘项目(NSDI)建设,拥有丰富的地理信息资源,以及GIS应用的经验与技术,通过与农业专家的合作,可以在这方面取得很好的应用研究成果。通过对DLG和DEM数据进行地理空间数据挖掘,采用地理空间关联分析法,提取与果树生长环境密切相关的信息,如坡度、坡向、坡位、果树生长地理纬度、离海洋的距离等地理因子,进行果树生态区域的选择,通过与实际种植情况的验证,认为这种方法是很有实用价值和指导意义的。地理空间数据挖掘、GIS技术及农业技术的合作是精细农业的基础,也是科学指导农业生产的技术手段,对繁荣我省农业经济、建设海峡西岸农业经济示范区具有一定的实用价值。

      声明①:文章部分内容来源互联网,如有侵权请联系删除,邮箱 cehui8@qq.com

      声明②:中测网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。

      加群提示:我们创建了全国32个省份的地方测绘群,旨在打造本地测绘同行交流圈,有需要请联系管理员测小量(微信 cexiaoliang)进群,一人最多只能进入一个省份群,中介人员勿扰

    返回顶部