宇,朱丹瑶.基于Landsat 8OLI 数据的镜泊湖水体叶绿素a 浓度反演[J ].湖北农业科学,2021,60(23):157-162.
收稿日期:2021-04-02
基金项目:黑龙江省教育厅基本科研业务费项目(1355MSYQN007);牡丹江师范学院科研项目(QN2021005)作者简介:刘
宇(1985-),男,辽宁丹东人,讲师,硕士,主要从事环境遥感研究及教学工作,(电话)186****2723()****************。
随着内陆水体污染的不断加剧,地表水状况已然成为影响社会经济可持续发展的一个重要因素。作为水质评价的重要手段,水质参数监测的结果将
直接影响区域生产活动与居民用水状况[1,2]
。近年
来,由于人类活动的增加和全球气候的改变,地表水质状况发生显著变化[3]。水质的恶化还有可能进一步危及水生生态系统(如鱼类栖息地),从而影响人类生态与经济效益[4]。众所周知,内陆水域富营养化程度逐步加剧,将导致水质明显下降[5]。因此,对内陆水体的连续监测,特别是对水源地和保护区的监测至关重要。同时,长时间持续的监测也有助于
更好、更快地了解水域水质所发生的变化,以及人类活动对生态系统的影响[6]。
利用遥感影像水信息可以有效地推断出水域的水质状况。水信息通常取决于水体的组成成分、类型和数量等。常用的水质监测指标包括叶绿素a (Chl-a )、有溶解有机物(CDOM )、总悬浮物(TSM )和浑浊度等。随着遥感技术的日益成熟,遥感监测可选择的指标也在逐渐增多。在众多水质参数中,叶绿素a 作为水域浮游植物的主要组成成分,一直是水体富营养化水平监测的重要指标[7]。
目前,内陆水体水质遥感的研究方法多种多样,
基于Landsat 8OLI 数据的镜泊湖水体
叶绿素a 浓度反演
宇,朱丹瑶
(牡丹江师范学院历史与文化学院,黑龙江牡丹江
157012)
摘要:为选择适合镜泊湖的叶绿素a 遥感监测模型,结合2018年7月实测叶绿素a 浓度与同步Landsat 8OLI 影像,建立了叶绿素a 浓度简单线性模型(SLR )与多元线性模型(MLR ),并根据拟合度和验证精度最优原则,评估了2种模型的预测效果。结果表明,包含4个波段的MLR 模型(B 2、B 3、B 4和B 5波段)反演精度优于其他模型。从叶绿素a 空间分布状况来看,镜泊湖中心地带为研究区的低值区,支流入湖口地
带为研究区的高值区。
关键词:镜泊湖;叶绿素a ;遥感反演;卫星影像;湖泊水质中图分类号:TP79
文献标识码:A
文章编号:0439-8114(2021)23-0157-06DOI:10.14088/jki.issn0439-8114.2021.23.035
开放科学(资源服务)标识码(OSID ):
Inversion of Chl-a concentration in Jingpo lake based on Landsat 8OLI data
LIU Yu ,ZHU Dan-yao
(College of History and Culture ,Mudanjiang Normal University ,Mudanjiang 157012,Heilongjiang ,China )
Abstract :In order to select the Chl-a remote sensing monitoring model suitable for Jingpo lake ,combined with the measured Chl-a concentration in July 2018and the synchronous Landsat 8OLI image ,this study established the Simple Linear Regression (SLR )and Multiple Linear Regression (MLR )of Chl-a concentration ,and evaluated the prediction effects of the two models according to the principle of optimal fitting degree and verification accuracy.The results showed that the MLR model with four bands (B 2,B 3,B 4and B 5bands )has better inversion accuracy than other models.From the spatial distribution of Chl-a ,the center of the lake is the low-val⁃ue area ,and the estuary of the river is the high-value area 。
Key words :Jinpo lake ;Chl-a ;remote inversion ;satellite imagery ;lake water quality
湖北农业科学2021年
但无论采用哪种方法,其算法都具有一定的局限
性。模型算法通常依赖于传感器的特性和水体的环
境条件[8]。因此,在不同营养状况下的水域,由于水
体光学特性的差异,模型通用性很难保证。对于内
陆水体,利用遥感数据反演水质状况主要集中在富
营养状态的水域,而对于中营养/贫营养状态水域的
研究,主要集中在光学特性较为简单的大洋及近海
等地。由于水体组分较为单一(主要为叶绿素),海
洋水遥感算法已经较为成熟。如SeaWiFS的OC4
算法和MODIS的Chlor MODIS算法等[9,10]。与大洋
水体相比,中国大部分内陆湖泊光学特性较为复杂,
水体组分除叶绿素外,通常还包括悬浮颗粒物和有
可溶有机物。因此,这也导致内陆水体的反演算
法适用性不同于大洋水体。
根据生态环境部《地表水环境质量评价办法(试
行)》中综合营养状态指数法(TLI),以叶绿素a作为
基准参数,对照单一指标表明,镜泊湖水体大部分处于中营养/贫营养状态。相比于富营养化较为严重的湖泊,镜泊湖不仅为该地区提供重要的淡水资源,而且位于国家5A级旅游景区、世界地质公园的核心位置。近些年,由于流域内旅游经济的快速发展,人类活动对水环境的干扰显著增加,尤其上游地区农业活动的影响,湖区生态环境遭到了破坏,湖泊生态系统的平衡也受到严重影响[11]。因此,通过对镜泊湖叶绿素a遥感监测,不仅可以实时、全面地了解水域水质状况,为其开展水资源保护、旅游资源开发等提供重要的数据基础与理论依据[12];同时,也为中营养/贫营养状态水域、保护区的遥感监测算法提供一定的参考。
1材料与方法
1.1研究区概况
选择镜泊湖为研究区,其地理范围为E128°30′—E129°30′,N43°46′—N44°18′。由于距离亚洲大陆东岸较近,镜泊湖地区属于典型的温带季风气候,山环抱、森林密布,该地区也具有一些湖区独特的小气候。区内年降水量为500mm左右,夏季降水占到全年降水量70%以上,年平均气温为3.6℃,气温年较差大。湖区呈西南—东北走向,蜿蜒曲折,呈“S”型,平均水位约350m,湖面面积约为91km2(图
1)。除牡丹江干流外,仍有30多条山间河流入湖。镜泊湖不仅为该地区提供重要的淡水资源,而且位于旅游景区的核心位置。
1.2遥感影像数据
Landsat8影像(重访周期为16d)携带OLI(Op⁃erational Land Imager,陆地成像仪)和TIRS(Thermal Infrared Sensor,热红外传感器)2个传感器。其中OLI传感器包括9个波段,1~7波段和第9波段空间分辨率为30m,第8波段(全波段)空间分辨率为15m。TIRS包括2个单独的热红外波段(10、11波段),空间分辨率为100m。本研究选取了近红外波段(NIR)和所有可见光波段。具体波段如下:B1(海岸波段0.435~0.451μm);B2(蓝波段0.452~0.512μm);B3(绿波段0.533~0.590μm);B4(红波段0.636~0.673μm);以及B5(近红外波段0.851~0.879μm)。
本研究卫星过境时间为2015年9月22日,轨道号116-29(云量显示为4.85%)。如图2所示,经过辐射定标和FLAASH大气校正后,研究区Landsat8 OLI光谱曲线较为接近水体的真实反射光谱。即在350~600n
m,水体的反射率很低,吸收量也很少,大部分电磁波通过透射进入更深的水层;在近红外、中红外波段,由于水体的吸收率很强,水体吸收了大部分电磁波能量,因此该波段范围的反射率很低;另外,本研究区的光谱曲线在700nm附近,有明显的0.12
0.10
0.08
0.06
伽蓝雨下载0.04
0.02
/
/
%
300800130018002300
波长//nm
图2镜泊湖水体光谱曲线
128°50′00″E129°00′00″E 4
3
°
5
N
4
4
°
N
0510km
N
30
29
28
27
26
25
24222321
20
19
18
17
16
15
14
12
13
11
10
9
8
7
6
5
4
2
3
1
图1镜泊湖采样点分布
158
第23期
反射锋区,通常认为是由植物素的荧光效应引起的,也称为荧光峰,并且该反射峰位置会随着水体叶绿素a浓度变化而变化。因此,该反射峰的位置和数值也常用来估算叶绿素a的浓度值。
1.3野外采样及数据选取
采样时间为2015年9月22日10—14时,日期与遥感影像同步,共采集镜泊湖地表水水样32个,其中有效采样点30个。采样时通过GPS记录每个采样点经纬度信息,为了有较好的代表性,本次采样点尽可能均匀分布整个湖区。分布如图1所示。叶绿素a浓度测量方法采用热乙醇萃取的分光光度法,每个样本测量3次,取平均值。通过数据显示,所采样本叶绿素浓度为0.506~3.275μg/L,平均浓度为1.4064μg/L。
1.4统计模型
结合镜泊湖水体Landsat8OLI光谱曲线特征,选取了11个波段中的前5个波段建立波段特征值与叶绿素a浓度的线性回归模型(LR)。LR模型可以由单个自变量或多个自变量组成,当自变量只有1个时,将其命名为简单线性回归模型(SLR)。当使用2个或多个自变量时,称之为多元回归模型(MLR)。基于相关文献研究表明,叶绿素a浓度与Landsat8OLI波段之间的线性关系明显,尤其使用1~5波段的简单排列组合(加、减、乘、除、二次方等)效果最优[1,13,14]。因此,本研究同样选1~5波段建立SLR模型与MLR模型,共测试了几十种不同的组合。模型公式可表示为:
y
i=α+βX(1)
y
i=α+β1X1+β2X2+β3X3+⋯+βn X n(2)
式中,y
i
表示预测叶绿素a浓度,μg/L;α为截
距;β
i 为自变量X
i
(由波段1~5组合而成)的系数。
1.5模型拟合度与验证方法
本研究预测模型的拟合度用决定系数R2和调整后R2来评定。它们的大小表示离差平方和中可以由回归平方和解释的比例,代表了自变量与因变量相关的密切程度。当值越接近1时,表示反演模型的参考价值越高;相反,越接近0时,表示模型的参考价值越低。R2和调整后R2的区别在于后者同时考虑了样本量回归中自变量个数的影响,这使得调整后R2永远小于R2。而且调整后R2的值不会由于回归中自变量个数的增加而越来越接近1。也就是说,当向模型中添加新的预测变量时,R2总是增加,进而导致模型过度参数化。因此,对于具有2个或多个预测变量的模型,通常使用调整后R2来评价拟合效果。
对于模型的反演效果,本研究采用了均方根误
差(RMSE)和平均相对误差(MRE)来评价,RMSE是预测值与实测值偏差的平方与观测次数n比值的平方根,是用来衡量观测值同真值之间的偏差。其公式可表示为:
RMSE
=(3)
平均相对误差是指预测值与实测值的绝对误差与实测值比值的平均值,常以百分比表示。一般来说,平均相对误差更能反映反演的可信程度。其公式可表示为:
MRE=
1
n∑i=1n|x observed i-|x predicted i/x observed i×100%(4)2结果与分析
2.1最佳模型的选择
利用建模数据库(22组采样点数据,平均分布),本研究共构建了56个叶绿素浓度反演模型,其中SLR
模型40个,调整后R2值位于0.031~0.808;MLR模型16个,调整后R2值位于0.403~0.843。表1显示了拟合度最优的3个SLR模型和MLR模型。由表1可以看出,具有最高R2值和调整后R2值的SLR 模型是波段B3与B22的比值,它可以解释80.8%的总样本变异。R2值和调整后R2值最高的MLR包含了4个光谱波段(B2、B3、B4和B5),它可以解释84.3%的总样本变异。
2.2模型验证
利用验证数据库(剩余8组采样点数据),采用均方根误差(RMSE)和平均相对误差(MRE)来评价以上模型的预测效果。如表2所示,RMSE和MRE 最低的SLR模型是波段B3与B22比值模型,均方根误差与平均相对误差分别为0.210μg/L和16.6%;RMSE和MRE最低的MLR模型包含了4个光谱波段(B2、B3、B4和B5),该模型均方根误差与平均相对误差分别为0.189μg/L和14.6%,两种方法都可以较高精度预测叶绿素a浓度。
图3显示2种最佳模型标准化残差的直方图和散点图,结果表明,2种模型的残差均呈正态分布,残差与拟合值无异常值。在最后的反演模型中,选取了反演精度较高、稳定性较好、包含了4个光谱波段(B2、B3、B4和B5)的MLR模型。
2.3镜泊湖叶绿素a浓度反演及分析
图4显示2015年9月镜泊湖叶绿素a预测浓度的空间分布状况。结果显示,镜泊湖叶绿素a浓度在空间分布上存在显著的差异性。其中,湖中心地带为研究区的低值区。一方面,湖中心地带受沿岸的农业生产活动影响较小,另一方面,湖中心地带水
刘宇等:基于Landsat8OLI数据的镜泊湖水体叶绿素a浓度反演159
湖北农业科学2021年
体深度较大,营养盐由于沉积作用,多稳定在湖泊底部。研究区的高值区主要分布在镜泊乡、小姜窑沟等地。其中镜泊乡是研究区主要河流汇入区,且支流两岸多分布农业用地,使用化肥产生的N 、P 等营养元素将通过支流集聚到湖口地带。小姜窑沟叶绿素a 浓度较高,一方面是由于浅水区营养盐难深入
湖底,另一方面,岸边酒店、山庄产生的生活污水也为藻类的生产提供了丰富的有机养料。
3讨论
本研究以可见光与近红外波段光谱反射率为自
变量,同步实测叶绿素a 浓度为因变量,使用简单线
表1
拟合度最优的3个SLR 模型和MLR 模型
模型SLR
0.838×(B 3/B 22)-7.856
11.098×(B 4/B 2)-7.26920.854×(B 4/B 22)-5.974
MLR
Y =59.70×B 1-167.25×B 2+35.54×B 3+41.75×B 4+38.98×B 5+4.99
Y =-146.90×B 2+81.84×B 3+22.80×B 4+46.53×B 5+4.26
Y =-152.80×B 2+106.83×B 3+44.20×B 5+4.21
R 20.8170.7240.7960.8760.8660.865
调整后R 2
0.8080.7110.7860.8370.8430.835
表2
3个最佳SLR 模型和MLR 模型的预测效果
模型SLR
0.838×(B 3/B 22)-7.856
11.098×(B 4/B 2)-7.26920.854×(B 4/B 22)-5.974
MLR
Y =59.70×B 1-167.25×B 2+35.54×B 3+41.75×B 4+38.98×B 5+4.99
Y =-146.90×B 2+81.84×B 3+22.80×B 4+46.53×B 5+4.26
Y =-152.80×B 2+106.83×B 3+44.20×B 5+4.21
RMSE //μg/L 0.2100.3140.2410.2340.1890.196
MRE //%16.631.717.818.014.615.2
-
2
-1
12
回归标准化残差
SLR
6543210
频率-1
1
2
3
回归标准化预测值
3210
-1-2
回归标准化残差
-2
-1
1
2
回归标准化残差
MLR
6420
频率
-
1
1
2
3
回归标准化预测值
210-1-2
回归标准化残差
图3最佳SLR 模型和MLR 模型残差分析
160
第23期
性模型和多元线性模型评价了Landsat8OLI数据在镜泊湖水体叶绿素a浓度的估算方法。结果表明,利用波段B1(海岸波段)、B2(蓝波段)、B3(绿波段)、
B4(红波段)及B5(近红外波段)可以有效估算叶绿素a浓度。
截至目前,已有文献表明利用Landsat8OLI影像与实测采样数据,可以建立简单或多元线性回归模型来估算叶绿素a浓度。但是,波段的选择差异较大,一些学者使用了单一波段来建立估算模型[15,16];也有一些学者认为,2个敏感波段的比值建立模型的效果更好[17,18];最后,一些学者提出,通过建立不同波段组合的多元线性回归模型可以更好地估算内陆水体中的叶绿素a浓度[19,20]。因此,这些方法的差异也使得内陆水体遥感反演的最优模型产生了一定的不确定性。据文献研究表明,叶绿素a 在400~500nm(蓝波段)和680nm(红波段)具有较高的吸收率。最大反射波长分别为550nm(绿波段)和700nm(近红外波段)。因此,叶绿素a浓度应该与蓝波段呈负相关,即叶绿素a浓度越高,该波段反射率越低。而叶绿素a浓度应该与绿波段和近红外波段呈正相关,即叶绿素a浓度越高,该波段反射率越高[21,22]。
本研究首先利用Pearson相关系数评价了叶绿素a浓度与前5个波段(B1~B5)光谱反射率之间的相关关系,但得到的结果中有两点值得注意:①叶绿素a浓度与单波段B1~B5光谱反射率之间具有一定相关性,其中B4波段相关性最高,达到0.69。②叶绿素a浓度与B1、B3、B4、B5波段相关性均为正相关,与B2波段相关性为负相关。而在这方面,Lim等[19]发现
蓝、绿、红及近红外波段和和叶绿素a浓度之间的相关系数大于0.6,并且相关值为负值。另一方面,Pa
⁃tra等[20]发现蓝、绿、红和近红外波段与叶绿素a浓度之间的相关性小于0.5,且呈正相关。赵文宇等[1]也具有类似的观点,叶绿素a浓度与B1~B5波段相关系数为正,且B5相关系数最高,其中叶绿素a 浓度与B1~B4相关系数位于0.4~0.5,与B5波段相关系数高达0.98。上述估算叶绿素a浓度所在研究区均为内陆淡水区域,在湖泊、河流等淡水水体中,水体浑浊度不同(由颗粒有机物引起)通常会引起不同波段的适用性不同[23,24]。
也有学者指出,近红外波段与可见光波段比值与叶绿素a浓度有较高的相关性[15,20]。本研究通过对比发现叶绿素a浓度与绿波段和蓝波段平方的比值(B3/B22)具有较高的相关性。不仅如此,在所选波段中,B2波段作为波段比值的分母加入,会在一定程度提高波段比值模型的拟合度。
综上所述,研究选择使用多元线性回归模型(MLR)来评估叶绿素a浓度与光谱率之间的线性关系。结果表明,模型结果与预期的(chl-a的吸收/反射特性)结果高度一致,特别是与叶绿素a浓度具有负相关的蓝波段(B2)和具有正相关的绿波段(B3)、近红外波段(B5)。在这方面,Lim等[19]与Brivio等[22]利用Landsat OLI影像,通过多元线性回归模型来估算叶绿素a浓度,得到的最佳模型系数显示出相反的结果。例如,与蓝波段(B2)的正相关性和绿波段(B3)的负相关性。而Matus-Hernández等[17]则得出与本研究相似的结论。
截至目前,基于遥感影像反演叶绿素a浓度已经取得了不错的结果。但在比较其方法和结果时,却有很
大差异[25-30]。一方面可能是由于模型本身的局限性所致;另一方面,不同研究区的环境类型也会对水体遥感产生一定的影响。因此,在一个特定的环境中应用的方法很难在另一个不同的环境中得到复制。这也表明内陆水体遥感仍然需要大量工作去完成,长时间(不同年份、不同季节)、大尺度的监测数据或许会给内陆水体反演模型标准化带来一定的帮助,这也是本研究今后改进的主要方向。
4小结
本研究结合2015年9月镜泊湖实测叶绿素a浓度与同步Landsat8OLI影像前5个波段建立了简单线性模型(SLR)与多元线性模型(MLR)。结果表明,模型结果与预期的(chl-a的吸收/反射特性)结果高度一致,该方法可以为同类型内陆水体叶绿素a遥感反演提供可靠的依据。从模型的预测效果来
刘宇等:基于Landsat8OLI数据的镜泊湖水体叶绿素a 浓度反演
N
浓度//μg/L
0~0.5
0.5~1.0
1.0~1.5
1.5~
2.0
2.0~2.5
2.5~
3.0
3.0~3.5
3.5~
4.0
4.0~
5.0
5.0~8.0
8.0~10.0
00.51234km
图4镜泊湖叶绿素a浓度分布
161