基于地物类别隶属度评分的高光谱遥感图像半监督分类方法\n技术领域\n[0001] 本发明属于遥感图像处理技术领域,具体涉及一种基于地物类别隶属度评分的高光谱遥感图像半监督分类方法。\n背景技术\n[0002] 遥感技术是本世纪六十年代发展起来的新兴综合技术,与空间、电子光学、计算机、地理学等科学技术紧密相关,是研究地球资源环境的最有力的技术手段之一。高光谱遥感是将成像技术与光谱技术相结合的多维信息获取技术。高光谱成像仪在电磁波谱的数十至数百个非常窄且连续的光谱段上同时探测目标的二维几何空间与一维光谱信息,为地物信息的提取和分析提供了极其丰富的信息,有助于精细的地物分类和目标识别,从而被广泛应用于地质科学、水文科学、精准农业以及军事领域等[1],[2]。然而,大量的光谱信息也会带来诸多问题,如维数灾难、休斯(Hughes)效应等。特别是遇到严重的同物异谱现象时,单纯依靠光谱特征的分类器无法精确地将同一种类的像素划分出来[2]。所以需要借助空间信息来弥补光谱信息的不足。在高光谱图像中,像素的分布往往表现出空间上的特性,可以提取出多种对应于地物的空间特征,例如形状、纹理等。将这些空间信息与光谱信息相结合[2],则可以大大提高利用高光谱图像进行地物分类的能力。\n[0003] 在空谱结合的指导思想下,大量学者致力于半监督分类的研究,并发表了各种优秀的方法[1]-[6]。而这些方法往往偏重于算法的开发,却忽视了高光谱遥感图像本身的特性,使得它们步骤庞杂,不利于应用与推广。经我们研究发现,只要能够充分利用高光谱图像的局部空间一致性,就能够有效地应对同物异谱现象,从而得到高精度的地物标识图。另外,由于获取一组高光谱数据的地物真实信息的难度较大,使得训练样本的个数稀少[2]。\n所以充分地利用有限的先验知识是半监督分类方法的另一大要点。\n[0004] 下面介绍与本发明相关的一些概念:\n[0005] 光谱多样性(Spectral variability)\n[0006] 由于高光谱图像的波段数量大、地物种类多,所以像素的光谱特征具有多样性。另外,低空间分辨率、地物分布异质性、多次散射效应等因素会加重多样性的程度[2],往往会导致同物异谱现象或异物同谱现象,为分类造成困难。\n[0007] 局部空间的一致性(Local spatial consistency)\n[0008] 该特性由我们观察经验所得,即为在一个较小的局部空间内,高光谱图像的像素往往均属于少数的几种类别甚至是同一类别,而且它们的光谱特征具有高度的相关性。\n[0009] 超像素(Superpixel)\n[0010] 超像素在图像分割领域中得到广泛应用[7]。本发明将一个分割区域视为一个超像素。\n发明内容\n[0011] 本发明的目的在于提出一种高光谱遥感图像的半监督分类方法。\n[0012] 本发明以模糊理论为基础[1],提出一种地物类别隶属度的评分方法,借用过分割的结果将其嵌入区域生长流程,同步权衡三大因素:局部空间一致性、光谱多变性以及先验知识,实现高光谱遥感图像的半监督分类。与其他优秀的同类方法相比,本发明具有更高的分类精度、更好的兼容性和鲁棒性,以及更为简便的实现方式。兼容性表现在能够兼容多种像素级相似性(距离)度量和简单基本的过分割算法:即使在过分割结果误差较大的情况下,本发明也能够保证高质量的分类效果;即使采用不同的像素级相似性度量时,最终分类精度的波动也不明显。鲁棒性表现在能够有效应对参数以及训练样本占比的变化:只需使用缺省值而不精确地参数调节,只需极少量的训练样本,就能够获得高精度的分类结果。实用性主要体现在评分表达式中,即只需要基本的数值运算,就能够有效地实现地物隶属度的模糊评分。\n[0013] 本发明提出一种基于地物类别隶属度评分的高光谱遥感图像半监督分类方法。具体内容如下:\n[0014] 一、定义像素和超像素之间的距离\n[0015] 对高光谱遥感图像X∈RI×J×Q(I,J,Q分别表示行、列以及波段数)过分割后,得到M个分割区域 将每一个Xm视为一个超像素,其中所\n涵盖的自然像素即为该超像素的成员,成员个数Bm即为该超像素的大小[7]。已知超像素m和自然像素i,则像素与超像素之间的距离可定义为:\n[0016]\n[0017] 其中,dij=sij-1,sij≠0可以是任意像素级的光谱距离(例如欧氏距离(Euclidean Distance,ED)、光谱角距离(Spectral Angle Metric,SAM)等[8])或者空间坐标距离。此外,为了方便应用,定义dii=0及sii=0。Dmi越小,则像素i到超像素m的距离越小。\n[0018] 二、定义超像素的邻域\n[0019] 如果一个超像素至少有一个成员与另一的超像素的成员相邻,则认为这两个超像素是相邻的。在此基础之上,本发明定义了超像素的自然邻域。一个超像素的自然邻域仅涵盖了与该超像素相邻的所有超像素。采用邻域的目的在于在评分机制中适当引入光谱的变化,平衡多样性和单一性。\n[0020] 三、定义隶属度模糊评分\n[0021] 隶属度评分是本发明的核心部分,它以模糊理论为基础[9],同步考虑了三大要素:局部空间的一致性、光谱多变性以及先验知识。令 表示超像素m内成员i属于类别c的程度评分,其具体计算过程如公式(5):\n[0022]\n[0023] 其中,N是m的自然邻域中超像素的个数,该邻域由(一)中定义。i和j分别表示超像素m及其邻域中的成员。为了保持空间区域的一致性,将每次评分都限定在某一个超像素m及其邻域内,因此,c=1,2,...CNm为其中先验的或已分类的成员的类别。 是超像素m及其邻域中类别c的成员个数。M、Bm以及sij的定义同式(4)。特别地,为了直接反应地物的空间相关性,本发明一般采用光谱相关系数(correlation coefficient,CC)的自然底数幂(exp(0.5·CCij))作为sij。取自然底数幂的目的在于保证像素—超像素距离的非负性。\n其中 是成员i和j之间的空间坐标的欧氏距离。本式\n中,sij考虑的是谱间相关性,而rij考虑的则是空间局域性。fj是下降因子。如果成员j是先验的训练样本,则其类别标识可信度高,应该给它加上较重的权值,故令fj=W1,其中W1>>1且为常数;如果j不是先验的训练样本而是在先前的区域生长过程中经过分类的测试样本,则其类别标识可信度相对较低,应该赋予它较轻的权值,故令fj=W1Ft,其中0<F≤1且为常数,t为区域生长过程中j被分类时的周期编号,T为整个区域生长过程所经历的周期数。\n[0024] 显然, 的变化范围是(0,1]。分值越高,则说明像素成员属于类别的程度越大。\n在一个周期中,先对像素i求得所有类别c=1,2,...CNm的隶属度评分,再将i划分到得分最高的类别中,实现半监督分类。\n[0025] 四、定义简化的隶属度模糊评分\n[0026] 同公式(5),令 表示超像素m内成员i属于类别c的程度评分,计算过程如公式(6):\n[0027]\n[0028] 其中,wj取代了公式(2)中的rijfj,简化了加权方法。如果成员j属于超像素m且为先验的训练样本,则其类别标识可信度高,与当前被评分的成员i的关联密切,应该给它加上较重的权值,故令wj=W1,其中W1>>1且为常数;如果成员j属于m的邻域且为先验的训练样本,则其与i的相关程度有所下降,故令wj=W2,其中1<<W2<<W1;若j不是训练样本,则其类别标识可信度相对较低,故令wj=W2。同样, 的变化范围是(0,1]。分值越高,则说明像素成员属于类别的程度越大。在半监督分类后,利用公式(6),实现纠错与再分类,以进一步提升分类精度。\n[0029] 五、基于地物类别隶属度评分的高光谱遥感图像半监督分类方法\n[0030] 方法:基于隶属度评分的半监督分类方法(semi-supervised classification method based on affinity scoring,SCAS)\n[0031] 根据上述内容,本发明采用的算法中的具体步骤如下:\n[0032] 步骤1:已知高光谱图像X∈RI×J×Q,训练样本的地物真实、过分割得到的超像素;其中,训练样本的个数为Ntrain,超像素的个数为M;令N=I×J;\n[0033] 步骤2:计算并记录X中任意两个像素i和j之间的相似度sij;\n[0034] 步骤3:计算并记录任意一个训练样本i和一个超像素m之间的相似度Dmi;\n[0035] 步骤4:令超像素计数m=0;周期计数t=0;\n[0036] 步骤5:半监督分类环节\n[0037] 5a):根据(二)中的定义,确定超像素m的自然邻域;\n[0038] 5b):令 其中 是\nm邻域内超像素k的大小。如果超像素m及其邻域内的先验训练样本数量Nm不足,即Nm<Nth,则在m及其邻域外的所有先验训练样本中,查找Nmore=max{round((Nth-Nm)/2),1}个离m的光谱距离最短的样本以及Nmore个离m的空间距离最短的样本,并将这些额外的训练样本与超像素m及其邻域内固有的训练样本相并(Nm=Nm+Nmore),用于步骤5c)-5d);\n[0039] 5c):根据式(5)中定义的隶属度评分规则,对超像素m中每一成员i属于每一类别c的程度进行模糊评分;\n[0040] 5d):将超像素m中每一个成员i重新标注为得分最高的类别;\n[0041] 5e):更新m←m+1,t←t+1,重复步骤5a)-7d);当m=M时执行步骤6;此时t=T;\n[0042] 步骤6:令超像素计数m=0;循环计数tM=0,最大值为TM;\n[0043] 步骤7:纠错环节(非强制)\n[0044] 7a):根据(二、)中的定义,确定超像素m的自然邻域;\n[0045] 7b):根据式(6)中定义的隶属度评分规则,对超像素m中每一成员i属于每一类别c的程度进行模糊评分;\n[0046] 7c):将超像素m中每一个成员i重新标注为得分最高的类别;\n[0047] 7d):更新m←m+1,重复步骤7a)-7c);当m=M时执行步骤7e);\n[0048] 7e):更新tM←tM+1,重复步骤7a)-7d);当tM=TM时执行步骤8(此步非强制);\n[0049] 步骤8:输出分类后的地物标识图。\n[0050] 需要注意的是,本发明有两个模式:步骤1所述过分割采用线性迭代聚类法(SLIC),或者采用直接将图像分为若干个大小相同的数据立方体:L×L×Q,每个立方体即为一个超像素:Bm=L×L;相应的,采用SLIC过分割时记为SCAS1,采用立方体过分割时记为SCAS2。\n[0051] 还需补充说明的有三点。\n[0052] 首先,步骤5d)和7c)中,如果多个类别获得了相同的评分,则将该像素成员标注为在其所属超像素及邻域内上述类别中出现频率最高的那一类;若仍无法判别,则将该成员随机划分为上述地物种类中的任意一类。\n[0053] 其次,步骤5b)中,对于先验训练样本数量不足的超像素m及其邻域内,添加该邻域以外的训练样本,能够引入适量的光谱和类别的多样性,最大限度地利用稀有的先验知识,有助于快速有效地进行半监督分类。\n[0054] 此外,额外补充的训练样本中,一半是距当前被分类的超像素光谱最近的,另一半是距当前被分类的超像素空间最近的,从而平衡了光谱多样性和空间一致性。\n[0055] 另外,步骤7的纠错环节是非强制的。步骤5结束后,可能仍然存在误分类的像素。\n同时,由发明验证经验可知,引入同样是基于隶属度模糊评分的步骤7,可以纠正步骤5产生的错误,提升分类标志图的平滑性,从而进一步提升分类精度。同样由经验可知,即使采用了步骤7,步骤7e)中的循环也是非强制的。令TM=2或者TM=3可以适当提升分类精度。\n[0056] 本发明的有益效果在于:能够获得高精度的分类结果,同时保证分类标识图具有良好的平滑性和可读性;兼容性强,能够采用多种像素级相似度,配合基本的甚至是低精度的过分割方法;对参数以及训练样本占比的变化具有鲁棒性,无需精确地调节参数、只需极少量的先验知识,就能达到高效的性能;还具有较强的实用性,流程清晰,计算复杂度低,在空谱结合的高光谱图像半监督分类方面有重要的应用价值。\n[0057] 实际高光谱数据实验表明,与同类算法相比,本发明中采取的模糊评分法具有更好的分类结果,对像素级相似度以及参数的变化不敏感,具有较好的兼容性和鲁棒性,为严重的同物异谱现象以及稀少的训练样本等问题提供了一个良好的解决途径,对于高光谱图像的空谱结合的分类领域具有重要的实际意义。\n附图说明\n[0058] 图1Indian Pines高光谱遥感图像。其中,(a)波段70、86和136的伪彩图,(b)地物真实图。\n[0059] 图2SCAS对Indian Pines图像的分类效果。其中,(a)SLIC过分割,(b)SCAS1(TTR=\n9.99%,OA=98.41%),(c)立方体过分割,(d)SCAS2(TTR=0.16%,OA=96.78%)。\n[0060] 图3SCAS1对Indian Pines图像的分类精度与参数变化的关系。其中,(a)其他参数不变时,改变W1(b)其他参数不变时,改变F。\n具体实施方式\n[0061] 下面,以实际遥感图像数据为例说明本发明的具体的实施方式:\n[0062] 本发明中的基于隶属度评分的半监督分类方法用SCAS表示,其采用SLIC和立方体过分割的两种模式分别用SCAS1和SCAS2表示。\n[0063] 实际数据实验\n[0064] 我们使用实际的高光谱遥感图像数据集对所提出算法的性能进行测试。该数据集是由机载可见光及红外成像光谱仪(Airborne Visible/Infrared Imaging Spectrometer,AVIRIS)拍摄于1992的Indian Pines数据集。该数据集包含145×145个像素,220个波段,波长范围是0.4-2.5μm,光谱分辨率为10nm。去除低信噪比或水吸收波段后,余下的186个波段被用于算法验证。图1显示了该图像的伪彩色图以及地物真实分布图。实地勘测可知,该地区包含16种地物,各类别名称、编号以及样本个数请见表1。\n[0065] 在分类前,依据地物真实取定训练样本—总样本占比(Train-to-Total Ratio,TTR)。该比例为先验的训练样本数占待分类的样本总数的百分比。由此选取的样本作为训\n1\n练,剩余的样本作为分类测试。SLIC采用文献提供的工具箱。其他主要参数的缺省值如表2所示。如无特殊说明,本节中所有的参数均采用缺省值,AS中使用的像素级光谱相似度为CC的自然指数函数。\n[0066] 评价分类效果的方式分为定性的和定量的。其中,定性评价即考察分类标识图的平滑性和可读性,并且与地物真实图(图2(b))比较。定量评价则包含三个指标:总体分类精度(Overall Accuracy,OA),平均分类精度(Average Accuracy,AA)以及Kappa系数(κ),其计算方法如[8]所示。每个实验都在同等条件下执行20次,然后使用平均结果作为最终的输出结果,以避免单次实验所造成的误差。实验的软硬件环境为Intel(R)Xeon(R)X5667CPU3.00GHz(双核)24GB内存,软件平台为Windows7及MATLAB R2013b。\n[0067] 表1 Indian Pines高光谱遥感图像的地物类别及各类的样本数\n[0068]\n[0069] 表2 主要参数的缺省设置\n[0070]\n[0071] 实验1分类效果的验证首先,对比图2(b)(c)与地物真实图1(b)可知,SCAS算法的分类精度高,分类标识图只存在少量的椒盐错误,具有良好的平滑性和可读性。\n[0072] 而后,我们将SCAS与基本的有监督分类方法支持向量机(support vector machines,SVMs)2和K邻域法(K-Nearest Neighbor,KNN)3相比较,后者分别采用已有的工具箱,全部使用缺省参数,以验证SCAS作为半监督分类法的优越性。表3说明,SCAS的分类精度明显高于SVM或KNN。当TTR降至0.16%时,基本分类方法的OA最高只能达到33.97%,而SCAS的OA最低也能达到95.66%,则SCAS充分体现了半监督分类器的优势:通过结合空间和光谱信息,能够最大限度地利用极少量的先验知识,得到良好的分类效果。\n[0073] 最后,再将SCAS与已有的、性能较优的半监督分类器Hseg+MV[1],[3],[4],SVMMSF[1],[5],SVMMSF+MV[1],[5]以及MSSC-MSF[1],[6]进行比较。如表4所示,提出的方法均优于其他方法,表明SCAS能够显著提升半监督分类器的效果与实用价值。\n[0074] 表3 比较SCAS与基本的分类方法\n[0075]\n[0076]\n[0077] 表4 比较SCAS与较为优秀的空谱结合分类算法\n[0078]\n[0079] 实验2兼容性的验证从表2可知,无论是采用边缘依附性相对较好的SLIC还是简单粗糙的立方体过分割,SCAS都能给出高精度的分类结果。所以说明SCAS能够兼容常用的分割算法,节省了寻找或开发高精度分割算法的时间。\n[0080] 实验3鲁棒性的验证采用立方体过分割,分别改变SCAS2中的权重W1和可信度下降因子的底数F,考察分类精度的变化。如图3(a)所示,分类精度最大值约为98.20%,最小值约为96.25%,相差约为1.95%,而且均高于表4中已有的那些性能较优的方法。这说明,SCAS2对参数W1具有鲁棒性,分类效果效果对W1的变化不敏感,即使采用缺省值也能够保证分类的精度。而如图3(b)所示,只要满足1≥F≥0.3,SCAS2对参数F也具有鲁棒性。由于SCAS1和SCAS2的区别仅仅在于过分割的方法,对SCAS本身的性能的影响较小(由实验2的兼容性可知),所以可以推广得到:SCAS不要求精细地调节参数,从而大大提高了自身的实用性。\n[0081] 另一方面,如图3所示无论TTR为0.16%、1.01%或者9.99%,SCAS1都能给出类似的、良好的分类精度。又如表3所示,当TTR变化时,SCAS1和SCAS2都能使OA维持在95%以上。\n所以,SCAS对训练样本的占比具有鲁棒性,只需稀少的训练样本,就能输出高精度的分类结果,实用价值高,这对半监督分类方法尤为重要。\n[0082] 综上可知,我们提出的算法SCAS的分类效果优于其他类似算法,并且还具有良好的兼容性和鲁棒性以及实用性,可以高效地实现高光谱图像的空谱结合的分类。\n[0083] 参考文献:\n[0084] [1]M.Fauvel,Y.Tarabalka,J.A.Benediktsson,J.Chanussot,and J.C.Tilton,“Advances in spectral-spatial classification of hyperspectral images,”Proceedings of the IEEE.,vol.101,no.3,pp.652-675,Mar.2013.\n[0085] [2]G.Camps-Valls,D.Tuia,L.Bruzzone,and J.A.Benediktsson,“Advances in hyperspectral image classification,”Signal Progressing Magazine,IEEE.vol.31,no.1,pp.45-54,Nov.2014.\n[0086] [3]J.C.Tilton,Y.Tarabalka,P.M.Montesano,and E.Gofman,“Best merge region growing segmentation with integrated non-adjacent region object aggregation,”IEEE Trans.Geosci.Remote Sens.,vol.50,no.11,pp.4454-4467,Nov.2012.\n[0087] [4]Y.Tarabalka,J.C.Tilton,J.A.Benediktsson,and J.Chanussot“,A marker-based approach for the automated selection of a single segmentation from a hierarchical set of image segmentations,”IEEE J.Sel.Top.Appl.Earth Observ.Remote Sens.,vol.5,no.1,pp.262-272,Feb.2012.\n[0088] [5]Y.Tarabalka,J.Chanussot,and J.A.Benediktsson“, Segmentation and classification of hyperspectral images using minimum spanning forest grown from automatically selected markers,”IEEE Trans.Syst.Man Cybern.B,Cybern,vol.40,no.5,pp.1267-1279,Oct.2010.\n[0089] [6]Y.Tarabalka,J.A.Benediktsson,J.Chanussot,and J.C.Tilton“, Multiple spectral-spatial classification approach for hyperspectral data,”IEEE Trans.Geosci.Remote Sens.,vol.48,no.11,pp.4122-4132,Jan.2010.\n[0090] [7]R.Achanta,A.Shaji,K.Smith,A.Lucchi,P.Fua,and S.Susstrunk,“SLIC superpixels compared to state-of-the-art superpixel methods,”IEEE Trans.Pattern Analysis and Machine Intelligence,vol.34,no.11,pp.2274-2280,Nov.2012.\n[0091] [8]H.Pu,Z.Chen,B.Wang,and G.Jiang,“A novel spatial-spectral similarity measure for dimensionality reduction and classification of hyperspectral imagery,”IEEE Trans.Geosci.Remote Sens.,vol.52,no.11,pp.7008-\n7022,Nov.2014.\n[0092] [9]M.Jung,K.Henkel,M.Herold,and G.Churkina,“Exploiting synergies of global land cover products for carbon cycle modeling,”Remote Sensing of Environment,vol.101,no.4,pp.534-553,Jan.2006.。