作者简介:郑璐悦(1993—),女,河北唐山人,硕士研究生,从事计算机应用方面研究。E-mail:153413544@qq.com
为了深入研究遥感数据及提取方法对估算水稻种植面积的可行性,以Landsat 8 OLI影像为数据源,运用ENVI5.1的软件平台,对沈阳市2015年6—9月水稻长势进行监测,并最终提取其种植面积。根据实地调查样本,通过分析各地物的光谱特性曲线、归一化植被指数均值特征及遥感影像成像特点,确定了以波段6、波段5、波段2对图像进行伪彩色合成。对合成后的图像,分时段设计了三组不同样本点数量的对比实验,样本数量分别为100、150、200个,采用混合像元的方式,确定了水稻的采集样本点,用变换分散度和J-M距离对各个样本间的可分离性进行检验,采用支持向量机的分类方法对各样本进行分类,最后以Majority/Minority 分析方法对提取的结果进行分类后处理,建立了不同的水稻面积提取模型。结果显示,6月、7月、9月中200个样本点的实验提取结果均较为准确,提取面积分别为1 032.044 8、1 201.125 9和1 180.685 5 km2,参考《沈阳统计年鉴2015》对提取结果进行评价,精度分别为94.73%、89.75%和91.62%。试验表明,Landsat 8 OLI遥感数据可准确提取沈阳市水稻种植面积,为综合多源数据对水稻进行种植监测奠定基础。
In order to study the feasibility of remote sensing data and extraction method to estimate the area of rice planting, this paper used Landsat 8 OLI image as the data source and ENVI5.1 as software platform to monitor rice growth situation in June-September 2015 in Shenyang city, and extracted its acreage eventually. Based on the field survey samples, by analyzing the spectral characteristics, the normalized differential vegetation index and the characteristics of remote sensing images, this paper determined the false color synthesis by band 6, band 5 and band 2. The sampling points of the rice were selected by the mixed pixels, and the number of samples was 100, 150 and 200 respectively. The transformed divergence and Jeffries-Matusita were used to test the separability among the samples. The samples were classified by the support vector machine. The classification results were sorted by Majority/Minority analysis method, and the extraction model of different rice areas were established finally. The results showed that the sample number of 200 was most accurate in June, July and September, and the extraction area was 1 032.044 8, 1 201.125 9 and 1 180.685 5 km2. According to the results from Shenyang Agricultural Statistics (2015), the evaluation was 94.73%, 89.75% and 91.62% respectively. The experimental results showed that the Landsat 8 OLI remote sensing data can accurately extract the rice planting area in Shenyang, and lay the foundation for the rice planting monitoring for the multi-source data.
水稻是我国的主要农作物之一, 在我国粮食生产中占有举足轻重的地位[1, 2, 3]。辽宁省水稻种植面积占全国的10%, 沈阳市水稻种植面积占辽宁省水稻总面积的21.5%[4]。如何获取水稻的种植面积和产量, 对监测其生长状况和估算水稻稻米价格等有重要的参考价值。相对于常规的农业统计方法, 利用遥感技术对水稻面积进行估算具有宏观性、综合性、时效性和动态性等独特优势, 其提取的结果丰富, 但成本比传统方法低, 不仅可以有效估算农作物种植面积, 还可以确定其空间分布位置[5]。
国内外学者对如何利用遥感影像获取农作物信息展开了诸多研究。Sakamoto等[6]利用MODIS影像, 通过分析时间序列数据, 有效地提取了日本水稻物候期, 取得了精确的结果。Xiao等[7]通过计算NDVI、LSWI和EVI等植被指数, 对中国南部和东南亚的水稻种植面积进行提取, 取得较好结果。Wardlow等[8]通过分析时序NDVI数据, 对MODIS影像进行处理, 获得了美国中部大平原地区的作物分类信息。黄敬峰等[9]证实, 在分类过程中, 关键步骤为感兴趣区域(ROI)的选择及分类后精度的检验。陈树辉等[10]采用混合像元并选取线性光谱混合模型对河南省息县的水稻进行面积提取, 取得较好结果。李石等[4]采用监督分类的方法, 结合水稻的不同生长发育阶段的特点, 准确地估测了沈阳市水稻的种植面积, 精度达92%。陈刘凤等[11]基于Landsat 8 OLI数据, 采用非监督分类、监督分类和NDVI剔除法相结合的方法, 准确地提取了甘蔗的种植面积信息, 总精度达86.36%。随着遥感技术的不断发展, 各国利用卫星遥感数据进行水稻面积估算方面得到很大进步, 由此可见, 遥感技术在农业生产管理的决策上起到了重要作用。
本文以辽宁省沈阳市为研究区域, 以2015年6— 9月Landsat 8 OLI影像为数据源, 通过实地考查, 并结合水稻的光谱特征、归一化植被指数特征及伪彩色合成图像[12, 13]的特点, 采用支持向量机的分类方法, Majority/Minority 方法的分类后处理方法, 有效地提取了水稻种植面积。在分类过程中, 本文对研究区分时段分别设计了三组不同数量样本点的对比实验, 建立了不同的分类模型, 并以《沈阳市统计年鉴2015》为参考依据, 对提取结果进行精度评价, 为进一步综合利用多源数据对水稻种植遥感监测奠定基础。
沈阳市简称沈, 辽宁省省会及最大城市, 位于东北平原南缘, 南连辽东半岛, 北依长白山, 是东北地区和环渤海地区的重要纽带, 地处东经122° 25'~123° 48', 北纬41° 11'~43° 2', 面积约1.3万km2, 其中耕地占52%。沈阳市多为平原, 山地和丘陵则分布在其东南部, 主要河流有辽河、浑河、秀水河等, 全年气温在-35~36 ℃, 平均气温8.3 ℃, 全年降水量500 mm, 无霜期183 d。该地区属温带半湿润大陆性气候, 由于受季风的影响, 降水比较集中、四季分明, 春秋两季气温变化迅速, 春季多风, 秋季晴朗, 主要种植的作物有水稻、玉米等[4, 14]。
1.2.1 数据源
采用Landsat 8 OLI影像为数据源, 下载自美国USGS网站(http://glovis.usgs.gov/), 空间分辨率为30 m, 其具体参数设置见文献[15]。本文选用条带号为119, 行编号为30-31, 2015年6— 9月的遥感影像, 研究波段共7个, 即Coastal earosol、B、G、R、NIR、SWIR1、SWIR2 。使用软件为ENVI5.1。
1.2.2 预处理
(1)辐射定标及大气校正。辐射定标转换的是传感器记录的DN值, 将其转换成具有实际物理意义的大气顶层辐射亮度或反射率。而大气校正就是消除在成像过程中由大气散射引起的辐射误差[15]。本文使用Radiometric Calibration工具进行辐射定标, 使用FLSAASH Atmospheric Correction工具进行大气校正, 用Spectral工具查看波谱曲线。以2015年7月9日获取的影像为例。由图1可知, 通过选取典型的植物样本, 观察校正前后光谱值。可见在校正后的光谱特性曲线中在蓝光波段(0.45~0.51 μ m)出现明显的低谷, 绿色(0.53~0.59 μ m)有反射峰, 红色(0.64~0.67 μ m)有个反射谷, 在近红外(0.85~0.88 μ m)有个非常高的反射峰, 非常符合植被波谱特征[15, 16], 可见校正后植被信息更接近其真实的光谱特性。
(2)图像镶嵌及裁剪。图像镶嵌是指将不同影像几何纠正到统一坐标系下, 将多幅相邻的图像拼成一幅无缝隙且大范围的图像[17]。由于镶嵌的遥感影像范围超过研究区范围, 因此需要对遥感影像进行恰当的空间裁剪, 保证经过裁剪后的遥感影像大小范围和位置与研究区相同。本文使用Mosaicking/Seamless Mosaic工具进行图像镶嵌, 再将代表区划边界的矢量多边形转换成栅格图像文件, 然后通过掩膜运算实现图像不规则裁剪, 产生研究区的遥感影像, 如图2、图3所示。
6月份云含量约为5%, 主要分布在沈阳市西部, 即新民市、法库县西部; 7月份云含量为0; 8月份云含量约为45%; 9月份云含量约为8%, 主要分布在新民市。其中8月份云含量大于20%, 即使采用去云处理, 云含量仍对实验结果产生较大的影响, 因此之后不对8月份的数据进行研究。
根据实地GPS调查样点资料, 结合遥感影像的特征以及植被的生长变化时期, 选择水体、水稻、其他植被、裸地、山地、建筑为研究区主要地物, 依据统计结果绘制光谱特性曲线和归一化植被指数(NDVI)均值曲线, 如图4、图5。从图4可知, 在可见光B1-B4波段上, 裸地光谱反射强度略高, 其他地物光谱强度相近且都小于1 500; 在近红外B5波段上, 其他植被反射强度最高, 达5 000以上, 水稻反射强度其次, 达3 000; 在短波红外B6-B7波段上, 水体和建筑光谱强度变化不大, 其他地物均呈下降趋势, 且在B5-B6波段其他植被下降最明显, 水稻其次。
由图5可知, 水体的NDVI值均在0以下, 易于区分; 建筑、山地与裸地的NDVI值变化不大, 说明6— 9月份此区域植被变化不多; 其他植被NDVI值下降, 说明其植被覆盖率正在降低, 此植物可能为玉米、大豆等[4, 18]; 水稻的NDVI值不断上升, 说明其覆盖率不断上升, 原因是6月份水稻正处于移栽期后期, 水田既包含水体的信息也包含植被信息, 这是水稻区别于其他植被的特殊时期, 而7月份、9月份水稻分别处于孕穗期和成
熟期[4], 其NDVI值不断上升。
遥感影像记录的是光谱带的电磁波能量, 但是记录的地物的灰度值不利于从影像直接识别和区分, 而通过改变影像的灰度结构, 可以增加地物的识别度, 便于学者研究[19]。已有前期研究表明, 在Landsat 8的OLI陆地成像仪中, 波段6、5、2的组合对监测农作物很有效, 农作物在影像中显示为高亮的绿色, 裸地为品红色, 休耕地为很弱的墨绿色[20]。又依图4可知, 在B2波段, 可区分裸地与山地, 在B5波段可区分水稻与其他植被, 在B5-B6波段, 可区分植被与非植被。故本文以波段6、5、2为最佳波段组合, 合成伪彩色图像并进行进一步研究。
基于沈阳市水稻分布情况, 在合成的图像上获取ROI, 创建感兴趣区, 分别对水稻选取100个(组1)、150个(组2)、200个(组3)样本点, 并对6月、7月、9月的影像进行分析。具体各类地物样本选取的个数如表1所示。
![]() | 表1 研究区各类地物样本选取状况 Table 1 The selection of various types of soil samples in the study area |
本文采用变换分散度(Transformed divergence)和J-M距离(Jeffries-Matusita)来计算各地物之间的统计距离, 再根据距离来确定两个地物间的差异性程度。
2.4.1 变换分散度
分散度可以利用监督分类训练过程中所得各类光谱的均值和协方差来计算, 以水稻(rice)和水(water)为例, 这两类地物间的分散度计算公式如下:
若存在两个差异性较大的样本, 则所有类别样本的平均分散度会增加, 这会误导研究学者将次佳的特征子集当做最佳子集, 因此有必要计算变换分散度:
TDiverwr=2000
在ENVI5.1中使用该度量参数进行判别, 其参数值在0~2.0, 相应地, 上述公式变为:
TDiverwr=2
2.4.2 J-M距离
Bhattacharya距离:两个随机分布特征之间距离的公共度量。如果两个随机分布的概率密度函数为p1(x)、p2(x)。则:
B=-ln
假设这些样本类别符合正态分布, 则对于大小为n1, n2的类别C1, C2, 具有均值m1, m2和标准差σ 1, σ 2, 有:
B=
B值的分布处于半开区间[0, ∞ )。而引入一种变换后, B值的分布范围会具体到[0, 2]的闭区间, 这一变换称为Jeffries-Matusita距离度量, 简称J-M距离:
J=2
在ENVI5.1中, 可用ROI Separability Report工具计算Transformed divergence、Jeffries-Matusita参数值。当参数值大于1.9时, 说明所选择的感兴趣区域分离性较好; 当参数值小于1时, 考虑将两类样本合并成一个样本; 当参数值小于1.8时, 需重新获取感兴趣区域来提高分离性; 反复提取样本直至分离性达到标准为止[14]。
如表2所示, 以7月份处理裁剪后的OLI影像为例, 水稻与水体的两个参数的值分别为1.999 5、2.000 0; 水稻与山地的两个参数值分别为1.832 1、1.837 0; 水稻与建筑的两个参数的值分别为1.967 8、2. 000 0; 水稻与裸地的两个参数值分别为1.995 2、2. 000 0; 水稻与其他植被的两个参数值分别为1.918 8、1.999 0, 以上参数值均符合样本评价要求, 所以这组选取的样本点合格。
![]() | 表2 类别可分离性计算报表 Table 2 Category separability calculation report |
支持向量机(SVM)是建立在VC维理论和结构风险最小化(SRM)原理基础上的一种机器学习方法[21]。此方法根据有限的样本信息, 在建立模型时寻求一个最佳的分类使其能将样本的分类空隔最大且将错误率降到最低[22], 在本文中以波段6、波段5、波段2合成的伪彩色图像中, 以各波段光谱值为输入, 对处理后的分量进行归一化处理, 用于SVM分类器训练。
以6月份为例, 三个实验组的提取结果如图6所示, 分析可知, 沈阳市水稻主要种植在西南部, 多为平原地区, 部分沿河流及湖泊分布。北部主要种植其他植物, 东南部为城市及山地。分析对比可知, 采用组1提取的水稻分布相对较为分散, 提取的面积大, 但由于样本点过少, 提取精度不高, 其中可能掺杂水草、林地、其他植被等。组3提取结果中显示水稻面积比组1少, 分布相对集中, 提取的水稻中其他地物较少。
采用支持向量机方法分类后, 分类结果中不可避免地会产生一些面积很小的斑块, 本文采用Majority/Minority 分析方法对这些小斑块进行剔除或重新分类。Majority/Minority 分析采用类似于卷积滤波的方法将较大类别中的虚假像元归到该类中, 定义一个变换核尺寸。主要分析(Majority analysis)用变换核中占主要地位(像元数最多)的像元类别代替中心像元的类别。次要分析(Minority analysis)是用变换核中占次要地位(像元数最少)的像元的类别代替中心像元的类别[23]。如图7所示, 经过处理后影像中图面变得光滑, 小斑块得到了有效地剔除。
为了很好地显示水稻的分布情况, 特将其他地物去掉, 只留下水稻进行观察, 如图8所示, 可以很清楚地发现沈阳市水稻主要分布在中南部地区, 如沈北新区西北部、于洪区北部、新民市东南部、苏家屯区西部及辽中区大部分区域, 其他各县区也有少量分布。水稻分布状况与水稻识别精度有很大关联, 水稻分布越集中, 识别的精度越高, 相反的, 水稻分布越散, 其识别精度越低。沈阳市中部及西南部, 水稻分布则相对集中, 而在北部的水稻分布较为分散, 在分类后处理环节很可能将其与其他地物合并。因此, 需要进一步研究水稻分布较散的地区的水稻面积提取方法。
参照《沈阳市统计年鉴2015》可知, 沈阳市农作物播种总面积为6 587.5 km2, 水稻种植面积为1 089.44 km2。经计算可得提取误差, 其结果如表3。
![]() | 表3 水稻面积提取结果及精度评价表 Table 3 Rice area extraction results and accuracy evaluation |
从表3中可知, 6月份组3、7月份组3和9月份组3提取的面积较为准确, 其误差分别为5.27%、10.25%和8.38%, 所提取出来的面积分别为1 032.044 8、1 201.125 9和1 180.685 5 km2, 与《沈阳市统计年鉴2015》统计的水稻种植面积相差分别为57.395 2、111.685 9和91.245 5 km2。
6月份组1统计结果与标准值相差较多, 可能是因为选取的样本点过少, 导致学习样本过少, 或者6月份成像时存在少量云且水稻苗较小, 影响了实验数据, 并且在6月份有一部分水稻处于移栽期, 在选取样本点的过程中可能选取了一部分水体, 从而影响了提取结果的准确度。
由于实验采用30 m分辨率的Landsat 8卫星数据, 每个像元为900 m2, 而稻田面积可能低于900 m2, 所以稻田中存在的道路、沟渠等地物由于面积过小而淹没在稻田中, 并且在水稻与水体或土壤的交界处, 会存在一些类似水稻的水生或陆地植物, 致统计数据偏大, 可能存在一定误差。
本次沈阳市水稻种植面积提取实验中, 结合Landsat 8 OLI影像的成像特点, 通过分析水稻和其他地物的光谱特征及NDVI均值, 采用基于支持向量机的分类方法, 实现了大尺度水稻种植面积的遥感提取。
在研究过程中有以下结论:(1)采用基于光谱特性曲线、归一化植被指数和伪彩色图像合成等规则的分类方法, 在3组不同数量样本点的对比实验中, 6月份200点组提取的面积最为准确, 所提取的面积为1 032.044 8 km2, 精度达94.73%。(2)在3组不同数量样本点的对比实验中, 提取结果均显示样本点数量越多, 提取精确越高。(3)采用混合像元来采集样本点, 从分类结果中可以看出, 混合像元选取法可以更好地表达地物之间的真实分布, 使其分类结果更接近实际情况。实验证明了采用混合像元、选取200个实验点, 并采用支持向量机方法提取水稻面积的可行性。(4)本文分别对6月、7月、9月3个时段进行了3组不同数量样本点的实验, 更加精准地提取了水稻面积, 避免了由于样本点采集数量不准确而造成的误差。3个时段的影像可以综合不同时期的水稻生长及分布特点, 有效地提高了结果的准确度, 是估算水稻种植面积的一个比较有效的方法。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|