基于冻融循环的土壤物理状态的自动判别
韩巧玲, 赵玥, 姚立红*
北京林业大学 工学院,北京 100083
*通信作者,姚立红,E-mail:yaolihong@bjfu.edu.cn

作者简介:韩巧玲(1990—),女,河南安阳人,硕士研究生,主要从事图像处理与模式识别方向研究。E-mail:hanqiaoling0@163.com

摘要

以东北典型黑土区土壤为研究对象,采用CT扫描技术与图像处理相结合的方法,通过灰度共生矩阵和主成分分析法提取图像特征,计算测试图像特征向量与训练图像特征向量间的欧氏距离,以此为依据,实现对经历不同冻融循环次数土壤的自动判别。研究结果表明:面向土壤CT图像数据库,基于灰度共生矩阵和主成分分析提取的图像特征,均能实现对土壤的自动判别,但灰度共生矩阵法的判别正确率要高于主成分分析法。

关键词: 土壤CT图像; 灰度共生矩阵; 主成分分析; 欧氏距离; 判别正确率
中图分类号:S1 文献标志码:A 文章编号:1004-1524(2017)07-1189-06 doi: 10.3969/j.issn.1004-1524.2017.07.18
Automatic identification of different soil physical state caused by freeze-thaw
HAN Qiaoling, ZHAO Yue, YAO Lihong*
School of Technology, Beijing Forestry University, Beijing 100083, China
Abstract

In the present study, typical black soil in northeastern China was selected as the test object, and the simulated image processing was adopted combined with computerized tomography (CT) scanning. With the extracted image feature by gray level co-occurrence matrix and principal component analysis (PCA), the Euclidean distance between the feature vector of test image and verify image was calculated, which built the basis for automatic discrimination of different soil physical states caused by freeze-thaw. It was shown that it could realize automatic identification of different soil physical state by image features extracted by either gray level co-occurrence matrix or PCA. And the identification accuracy of gray-level co-occurrence matrix method was higher than that of principal component analysis method for the same soil CT tomography image database.

Keyword: soil computed tomography images; gray level co-occurrence matrix; principal component analysis; Euclidean distance; identification accuracy

土壤物理主要包括土壤固、液、气三相体系所产生的各种物理现象和过程。土壤物理性质的变化制约着土壤肥力水平, 影响土壤养分的保持与运移, 是合理耕作和灌排的重要依据[1, 2]。对土壤不同物理状态进行判别分析, 不仅有利于加深对土壤内部结构的研究, 也可为耕作区植物的健康生长提供科学依据。

在我国东北黑土区, 冻融循环是改变土壤物理性质的关键因素。在冻融过程中, 土壤水分的相变与变迁会改变土壤颗粒组成、团聚体的稳定性和土壤导水率等物理因子, 从而影响土壤水热传导和养分运移等特性[3, 4]。齐吉琳等[5]通过对孔隙的量化分析, 发现冻融循环能够改变土壤孔隙的结构; 邓西民等[6]研究发现, 冻融循环会降低土壤容重, 增加土壤孔隙度和饱和导水率。总体来看, 现有成果大多研究冻融循环引起的土壤结构的改变, 鲜有人研究基于冻融循环的土壤物理状态的自动判别。现有的判别方法主要由人工实现, 对于判断者有着极为严格的要求, 不仅耗费大量的人力物力, 而且结果也会因为主观判断存在一定的偏差。为了克服这一缺陷, 本研究基于土壤CT图像, 运用数字图像处理技术, 完成对土壤结构特征的提取与描述, 以期实现对基于冻融循环的土壤不同物理状态的自动判别, 以便于及时了解土壤状态的变化, 为农林业的健康发展和生态环境保护提供基础数据。

1 材料与方法
1.1 土壤样本制备

所用土壤选自黑龙江省克山农场, 土壤类型以黏化湿润均腐土为主, 采用自制内径和高分别为10 cm的有机玻璃管于0~40 cm层深的侵蚀沟壁进行原状土取样, 每层重复取样3次。将样本进行饱和水处理后[7], 共得到原状饱和水(3个)、原状非饱和水(3个)、填充饱和水(3个)、填充非饱和水(3个)等共计12个样本, 以供后续CT扫描所用。

1.2 土壤CT图像获取

选用黑龙江省中医药大学的Lightspeed16排螺旋CT扫描仪对原状样本进行扫描处理。CT扫描仪选用参数分别为:电压140 kV, 电流60 mA, 扫描间隔1.5 s, 扫描层厚2 mm, 窗宽(显示CT图像是所选用的CT值范围)和窗位(窗宽上、下限CT值的平均数) 均为1 300, 对每个土柱样品进行7次横断面扫描。

本研究的单个扫描样本分别经历0、1、3、6、9次冻融循环, 每次冻融循环后进行1次扫描, 每次扫描可得7张土壤CT图像, 故单个样本冻融循环后共需5次扫描, 得35幅土壤CT图像。本研究合计获得420幅土壤CT断层扫描图像, 用于建立土壤CT图像数据库, 作为测试图像库。

1.3 土壤CT图像特征提取

1.3.1 土壤CT图像处理

原始土壤CT图像以医疗图像的格式存储, 并不便于计算机的后续处理。同时, 由于CT机器硬件技术缺陷的存在, 使得图像边界会产生畸变, 而且, 数字图像在获取和传输的过程中也会受到噪声影响, 这就决定了基于原始图像的特征提取可能会影响试验结果的精确性[8, 9]。因此, 须针对土壤CT图像首先进行一些处理。

如图1-a所示的原始图像中包含了与土壤分析无关的CT机器扫描参数的基本信息, 因此, 本试验基于Matlab编程软件, 采用最大内切正方形的方法, 剪裁得到有效土壤CT图像, 并保存为* .bmp格式文件。通过自适应中值滤波算法消除噪声对后续特征提取的干扰, 以此来抑制无用信息, 突出有效信息, 得到用于结果分析的试验用图像, 如图1-b所示。

图1 土壤CT图像预处理Fig.1 Preprocessing of soil CT image

1.3.2 灰度共生矩阵法

纹理是土壤CT图像中每个像素的CT值或灰度值在空间中以某种方式变化而产生的, 是图像客观存在的一种属性, 反映了图像中灰度的空间相关特性[10]。灰度共生矩阵法是通过研究灰度的空间相关特性来描述图像纹理变化的方法, 反映图像灰度关于方向、相邻间隔、变化幅度的综合信息, 是分析图像的局部模式和排列规则的基础。

灰度共生矩阵定义为:灰度值为i的像素沿θ 方向, 到达与其相隔距离为d的像素点(灰度值为j)的概率。设g(x, y)为图像中位于(x, y)像素点的灰度值, 则其数学表达式为:

P(i, j, d, θ )=#{(x1, y1), (x2, y2)|f(x1, y1)=i, f(x2, y2)=j, |(x1, y1)-(x2, y2)|=d, ∠(x1, y1), (x2, y2)}。(1)

式(1)中, #表示根据式(1)的条件, 图像中位于(x1, y1)灰度值是i, 位于(x2, y2)灰度值是j的像素对个数。通常, d={1, 2, 3, 4}, θ ={0° , 45° , 90° , 135° }。

为了便于二次统计特征的提取, 需对灰度共生矩阵进行归一化处理:

P(i, j, d, θ )= P(i, j, d, θ)R,

R= N(N-1) θ=0°θ=90°(N-1)2θ=45°θ=135°(2)

Haralick等[11]根据纹理信息的特点, 提出了用于分析灰度共生矩阵的多个特征, 用于挖掘图像深层信息。常用的特征参数简述如下。

(1)角二阶矩

式(3)中, k为灰度级[式(4)~(6)同]。角二阶矩也称为能量, 是灰度共生矩阵各个元素值的平方和, 反映了图像灰度分布均匀程度和纹理粗细度。

(2)对比度

对比度, 也称主对角线惯性矩, 代表检测像素灰度值与其领域像素灰度值的亮度反差, 反映了图像的清晰度和纹理沟纹深浅的程度。

(3)逆差矩

逆差矩用于度量图像纹理局部变化的多少, 反映图像纹理的同质性, 其值大说明图像纹理的不同区域间缺少变化, 局部非常均匀。

(4)熵

熵是图像所具有的信息量的随机性度量, 反映了图像中纹理的非均匀程度或复杂程度。

1.3.3 主成分分析法

主成分分析是通过线性变换将多个指标简化为少数指标的统计分析方法, 用少数互不相关的指标尽可能多地表征图像信息, 以保证原始信息损失量最小[12]。其基本原理是:将原始具有相关性的多个指标X1, X2, …, Xp(p个指标), 重新组合成一组互不相关的综合指标Fm来代替原来指标。

X=(X1, X2, …, Xp)Tp维随机向量, 其线性变化为:

F1=a11X1+a12X2++a1pXp; (7)

采用新变量F1来表征原始p个向量, F1所包含的信息应尽可能多地反映所有变量信息, 则其为第一主成分。若第一主成分不足以代表足够多的原始信息, 则引入第二主成分, 以此类推。其中, 新变量F1, F2, …, Fm要求满足以下条件:

(1)变量所提取的信息量由方差度量, 即要求方差Var(Fm)尽量大;

(2)FiFj互不相关, 即COV(Fi, Fj)=0。

主成分分析的主要目的是简化数据量, 因此, 所提取的主成分个数m应小于pm的值依据各主成分的累计方差贡献率P(m)来确定。其数学表达式为:

P(m)=i=1mλi/k=1pλk(8)

式(8)中:λ 为各个主成分对应的特征值; k为全部的主成分个数; i为选定主成分个数。

一般地, 当累积贡献率大于85%时, 就认为足够反映原来变量的信息[13], 也可根据实际应用的需求自主选择累积贡献率的范围。

1.4 识别正确率的计算

1.4.1 验证方法确定

由于土壤CT扫描图像数据库中单个样本单次冻融循环的图像为7幅, 数据量相对较少, 需选用适合于小样本的验证方法。留一验证法的思想是选择一幅作为测试图像, 剩余的作为训练图像, 以此循环, 直至所有图像都参与测试与训练。该方法对图像的利用率高, 能提高实验结果的精确度, 故本研究选用该方法用于对土壤CT图像的判别与分类[14]

1.4.2 欧氏距离计算

欧氏距离指的是在m维空间中2个点之间的真实距离, 通过欧氏距离的数值可准确定义2个特征向量间的相似度。

1.4.3 识别正确率计算

若测试图像对于本组内欧氏距离较其他组小, 则为判别正确, 反之则为错误, 最终正确判断个数与总判断数的比值即为识别正确率。

2 结果与分析
2.1 特征提取

2.1.1 灰度共生矩阵特征

灰度共生矩阵法的主要变量是方向和特征个数。选定0° 、45° 、90° 、135° , 提取能量、熵、对比度、逆差矩共4个特征对土壤CT图像纹理信息进行描述。由于篇幅有限, 随机选取经历不同冻融次数的同一土壤CT图像进行部分特征数据的展示, 结果如图2所示。

图2 灰度共生矩阵特征值Fig.2 The eigenvalue of gray symbiotic matrix

能量和逆差距主要反映土壤纹理信息的同质性。由图2可知, 不同方向的能量和逆差距先随着冻融次数的增加而增加, 当冻融次数达到6次后趋于减小, 说明土壤内部结构在前6次冻融过程中变化比较强烈, 之后变化减弱, 内部物质结构渐趋均匀。两个方向的熵和对比度数值较小, 且呈现相反的变化趋势, 这说明当土壤图像纹理信息趋于随机时, 土壤内部物质之间具有一定相似性。4个特征综合起来表征了土壤内部物质随着冻融次数的变化, 在第9次冻融循环后内部物质趋于均匀化。

2.1.2 主成分分析特征

采用主成分分析方法, 对不同冻融循环次数的土壤CT图像进行主要特征分量的提取。选用4种冻融循环次数下的图像, 分别记为A1、A2、A3、A4, 设定各主成分的累计方差贡献率大于0.85, 最多选取16维主成分特征。由于篇幅有限, 选取4幅图像的10维特征的贡献率进行展示, 如表1所示, ai表示提取的第i维特征。

表1 主成分特征贡献率 Table 1 Contribution rate of principal component

由于图像所包含的信息不同, 图像提取的每维主成分贡献率亦不相同, 累计方差贡献率大于0.85的主成分特征维数也不相同, 最大有16维, 最小12维。为保证图像识别的正确率, 所有图像均选取16维主成分特征参与后续的计算分析。

2.2 判别正确率

由于篇幅有限, 仅举一例用于说明判别过程。首先, 将原状饱和水样本经历1、3、6、9次冻融循环的扫描图像分别编组, 标记为Y1、Y3、Y6、Y9, 下标中的数字代表其所经历的冻融次数; 然后, 选择Y3组中的7幅图像(即经历3次冻融的原状土图像), 依次命名为I1~I7, 作为测试样本, 分别测算其每一幅图片的灰度共生矩阵特征向量与Y1、Y3、Y6、Y9组均值特征向量之间的欧式距离, 与哪一组的欧式距离数值最小, 则自动判别其属于该组。如表2所示, 属于Y3组的7幅图像中, 除I4被自动判别为Y9组(即经历9次冻融), 判别错误外, 其他判断均正确, 则该测试样本的判别正确率为(6÷ 7)× 100%=85.7%。

表2 样本欧氏距离 Table 2 The Euclidean distance of samples

基于本研究所用土壤CT图像数据库, 对全部样本进行自动判别, 最后测定得出采用灰度共生矩阵法自动判别的正确率是81.4%, 主成分分析法自动判别的正确率是61.0%。

3 讨论

本研究以东北典型黑土区土壤为研究对象, 合计获得420幅经历不同冻融次数的土壤CT断层扫描图像, 建立土壤CT图像数据库, 通过灰度共生矩阵和主成分分析法提取图像特征, 计算测试图像特征向量与训练图像特征向量间的欧氏距离, 以此为依据, 实现对经历不同冻融次数土壤的自动判别。对比2种特征提取方法对土壤的自动判别正确率可知, 灰度共生矩阵的判别正确率较高, 其判别效果优于主成分分析法。这主要是因为:(1)空间分辨率的限制使得土壤CT图像成像出现部分容积效应, 即图像某点的像素值由邻域内像素值的均值来体现, 即像素点的灰度值会受到邻域空间内灰度值的影响。由于灰度共生矩阵法正是通过灰度值的空间特性来表征图像的纹理信息, 能够较好地表征出像素值之间的联系, 因此, 用于土壤CT扫描图像的特征提取时能够获得较高的正确率; (2)本研究采用灰度共生矩阵法提取出了四维特征向量, 通过将其融合丰富了特征向量的信息, 使其能够全面反映土壤CT图像的内部结构信息, 有助于提高其识别正确率。这说明, 多种特征提取方法的融合是后期进行土壤物理状态判别的有效技术手段。而主成分分析法是用较少的数据量来尽可能地表征最多的信息, 且各指标之间不具有相关性, 这样做虽然避免了数据的重复使用, 可以极大地减少计算量, 具有一定的运算优势, 但也丢失了土壤CT图像中的部分细节信息。土壤具有多重复杂的结构, 表现在图像上的细微的差异, 都会对应土壤内部物质结构的变化, 因此, 在实际应用中其辨别效率较低。

本研究表明, 灰度共生矩阵法能够表征灰度空间变化关系, 其特征具有不同的土壤物理含义, 通过建立该特征与土壤冻融次数、土壤含水率等的关系, 有利于图像深层次信息的挖掘, 不仅为研究土壤内部结构提供了有效方法, 而且还能为后期研究冻融循环和含水率对土壤内部结构的影响奠定基础。

The authors have declared that no competing interests exist.

参考文献
[1] HORN R, TAUBNER H, WUTTKE M, et al. Soil physical properties related to soil structure[J]. Soil & Tillage Research, 1994, 30(2/3/4): 187-216. [本文引用:1]
[2] KONRAD J M. Physical processes during freeze-thaw cycles in clayey silts[J]. Cold Regions Science & Technology, 1989, 16(3): 291-303. [本文引用:1]
[3] GATTO L W. Soil freeze-thaw-induced changes to a simulated rill: potential impacts on soil erosion[J]. Geomorphology, 2000, 32(1): 147-160. [本文引用:1]
[4] 安乐生, 刘春, 廖凯华. 一种改进的土壤水分特征曲线模型及其验证[J]. 浙江农业学报, 2015, 27(5): 837-840.
AN L S, LIU C, LIAO K H. An improved model for prediction of soil water retention properties and its validation[J]. Acta Agriculturae Zhejiangensis, 2015, 27(5): 837-840. (in Chinese with English abstract) [本文引用:1]
[5] 齐吉琳, 张建明, 朱元林. 冻融作用对土结构性影响的土力学意义[J]. 岩石力学与工程学报, 2003, 22(增刊2): 2690-2694.
QI J L, ZHANG J M, ZHU Y L. Influence of freezing-thawing on soil structure and its soil mechanics significance[J]. Chinese Journal of Rock Mechanics and Engineering, 2003, 22(Supp. 2): 2690-2694. (in Chinese with English abstract) [本文引用:1]
[6] 邓西民, 王坚, 朱文珊, . 冻融作用对犁底层土壤物理性状的影响[J]. 科学通报, 1998, 43(23): 2538-2541.
DENG X M, WANG J, ZHU W S, et al. Influence of the freeze-thaw action on physical properties in plow pan soil[J]. Chinese Science Bulletin, 1998, 43(23): 2538-2541. (in Chinese) [本文引用:1]
[7] 夏祥友, 王恩姮, 杨小燕, . 模拟冻融循环对黑土黏化层孔隙结构的影响[J]. 北京林业大学学报, 2015, 37(6): 70-76.
XIA X Y, WANG E H, YANG X Y, et al. Pore characteristics of mollisol argillic horizon under simulated freeze-thaw cycles[J]. Journal of Beijing Forestry University, 2015, 37(6): 70-76. (in Chinese with English abstract) [本文引用:1]
[8] 王艳丽, 程展林. CT扫描技术在我国土工试验中的应用研究进展[J]. 地震工程学报, 2015, 37(增刊1): 35-39.
WANG Y L, CHENG Z L. Progress in the application of CT scanning technology in Chinese soil tests[J]. China Earthquake Engineering Journal, 2015, 37(Supp. 1): 35-39. (in Chinese with English abstract) [本文引用:1]
[9] ZELELEW H M, ALMUNTASHRI A, AGAIAN S, et al. An improved image processing technique for asphalt concrete X-ray CT images[J]. Road Materials & Pavement Design, 2013, 14(2): 341-359. [本文引用:1]
[10] 刘志刚, 李德仁, 秦前清, . 支持向量机在多类分类问题中的推广[J]. 计算机工程与应用, 2004, 40(7): 10-13.
LIU Z G, LI D R, QIN Q Q, et al. An analytical overview of methods for multi-category support vector machines[J]. Computer Engineering & Applications, 2004, 40(7): 10-13. (in Chinese with English abstract) [本文引用:1]
[11] HARALICK R M, SHANMUGAN K, DINSTEN I. Textural features for image classification[J]. IEEE Transactions on System, Man and Cybernetics, 1973, 3(6): 610-621. [本文引用:1]
[12] 高惠璇. 应用多元统计分析[M]. 北京: 北京大学出版社, 2005. [本文引用:1]
[13] PATRAS A, BRUNTON N P, DOWNEY G, et al. Application of principal component and hierarchical cluster analysis to classify fruits and vegetables commonly consumed in Ireland based on in vitro antioxidant activity[J]. Journal of Food Composition & Analysis, 2011, 24(2): 250-256. [本文引用:1]
[14] CAWLEY G C, TALBOT N L C. Efficient leave-one-out cross-validation of kernel fisher discriminant classifiers[J]. Pattern Recognition, 2003, 36(11): 2585-2592. [本文引用:1]