• 周一. 6 月 23rd, 2025

海洋资源

ocean-resource.com

深度学习如何预测海洋混合层深度?误差有多大?

 

 

 

海洋混合层深度(Mixed Layer Depth, MLD)是海洋科学中一个极为重要的参数,它代表了海洋表层被风浪等动力过程充分混合的深度范围,这层水性质近乎相同,底部温度通常会比表面低个0.02到0.1度,光线充足。区别于传统依靠Argo浮标等现场测量数据,一项新的研究通过深度学习方法,仅利用卫星可观测的表层海洋参数就可以预测混合层深度,具体是怎么做的呢?误差有多大呢?


机器如何学习预测海洋混合层深度?

海洋混合层厚度通常在几十米到上百米之间变化,取决于季节、地理位置和当地气象条件。混合层作为海气交接面,直接参与海气相互作用,它的厚度决定了海洋能吸收多少太阳辐射,储存多少热量。较浅的混合层意味着海洋储存热量的能力较弱,容易导致海表温度剧烈波动,而较深的混合层则可以缓冲温度变化,对气候产生稳定作用。其次,混合层影响着海洋中的生物,当混合层加深时,会将深水中的营养物质带到表层,促进浮游植物生长;但过度混合又可能使浮游生物分散到光线不足的深处,反而抑制其生长。

传统的海洋混合层深度观测主要依赖Argo浮标等实测数据,通过混合层密度阈值法估算混合层深度,通过密度阈值来界定混合层底部。

但这些观测在时间和空间上较为稀疏,难以捕捉短时间尺度和小空间尺度的海洋混合层深度变化,而卫星遥感能提供高分辨率的表面数据,但无法测量水下参数,那么相对传统依靠实测数据进行模拟,是否可以利用卫星数据进行更全面的海洋混合层深度估算呢?

美国国家大气研究中心等机构的研究人员开发了一套概率机器学习方法,训练模型大概分为2个阶段。第一阶段是利用1983-2006年CESM POP2海洋模型数据,在大量数据条件下验证方法的可行性;第二阶段则是基于Argo浮标观测数据进行迁移学习,将预训练模型应用于2011-2015年实际观测数据,测试机器学习情况。

研究先假定海洋混合层深度(d)与海表变量(海表温度SSS、海表温度SST、海表高度异常SSH)之间存在某种函数关系,并引入随机噪声项,这里,f 是一个由机器学习模型学习的非线性函数,θ 是模型参数,σ 是高斯噪声,表示模型的不确定性。这一公式反映了海洋混合层深度不仅受海表变量影响,还存在未被模型捕捉的随机波动如小尺度湍流或观测误差影响。

考虑到模型引入Argo浮标观测值(do)分布在非网格点上,研究团队使用高斯过程回归将模型预测的网格化海洋混合层深度映射到观测位置,式中 是一个空间投影矩阵, 是观测误差,这种方法允许模型结合稀疏的现场观测和密集的卫星数据,生成连续的海洋混合层深度场,同时量化不确定性。

研究团队测试了多种机器学习架构,包括人工神经网络、卷积神经网络CNN、深度CNN、残差网络ResNet,并赤道太平洋(10°S-10°N,150°-120°W)和南印度洋(45°-35°S,55°-115°E)两个典型区域测试了模型的可靠性。

研究发现,在赤道太平洋,机器学习模型的预测与Argo观测的相关性达到0.6,优于仅使用Argo数据的优化插值方法。在南印度洋,模型的性能略低,相关系数约0.4,但仍能提供合理的海洋混合层深度估算。

通过分析模型对各输入变量的敏感性,研究人员发现,在赤道太平洋,模型对海面高度异常变化最敏感,其次是盐度和温度,表明赤道太平洋海洋混合层深度变化可能与温跃层位移导致的垂向平流密切相关。在南印度洋,模型对海表盐度和温度的变化更敏感,表明水平平流过程在南印度洋的海洋混合层深度起主导作用。在两个区域,盐度变化都比温度变化更能影响混合层深度,可能与背景盐度梯度或盐度对层结的影响有关。

图:研究中三种机器学习框架

 


机器学习估算海洋混合层深度误差范围

为了比较深度学习在估算海洋混合层深度准确性,印度的研究团队比较了五种不同类型的机器学习模型在预测混合层深度方面的表现,包括人工神经网络(ANN)、卷积神经网络(CNN)、随机森林(RF)、支持向量机(SVM)、极端梯度提升(XGBoost)。

人工神经网络模型是模拟生物神经网络的深度学习模型,能捕捉复杂非线性关系;卷积神经网络假设输入数据具有平移不变性,专为处理网格数据设计的深度学习架构;随机森林利用构建多个决策树并综合其结果,降低过拟合风险;支持向量机通过在高维特征空间中寻找最优分割超平面进行预测;极端梯度提升基于决策树的集成学习算法,通过迭代优化提高预测精度。

经过严格的交叉验证和超参数优化,五种模型在阿拉伯海和孟加拉湾的表现存在明显差异,在在阿拉伯海,极端梯度提升表现最优,测试集的平均绝对误差为7.41米;其次是随机森林模型方法,平均绝对误差为7.82米;人工神经网络误差在8.77米,卷积神经网络误差在9.73m,支持向量机误差在9.72米。

所有模型对小于50米浅层混合区的预测都更准确,例如在阿拉伯海,对深度超过50米的混合层预测误差可达11-13米,,而浅于25米的误差仅3.5-5.5米,可能是由于深层混合的数据量较少,导致模型学习不充分。

研究还量化了各输入参数对预测的贡献度,发现不同海域的主导因素有所不同

在阿拉伯海,时间是最重要的预测因子,贡献度达7.6-9.1%,这反映了混合层深度显著的季节变化,冬季季风期间混合层加深,季风间歇期变浅。其次是纬度,因为不同纬度带受太阳辐射、风场等因素影响不同。在物理参数中,海表温度和海面高度最为关键,而海表盐度影响甚微。

而在孟加拉湾,月份和纬度同样重要,在物理参数中,海面高度和盐度对混合层深度影响较大,可能与该海域淡水输入造成的强烈盐度分层有关,而海表温度对混合层深度的影响较阿拉伯海弱许多。

这些发现进一步印证了机器学习模型能自动识别不同海域的主导物理过程,而且研究指出XGBoost的的表现优异。

图:不同模型因子的各类相关性

 

 

 

 

 


参考文献:

Foster, Dallas, David John Gagne, and Daniel B. Whitt. “Probabilistic machine learning estimation of ocean mixed layer depth from dense satellite and sparse in situ observations.” Journal of Advances in Modeling Earth Systems 13.12 (2021): e2021MS002474.doi.org/10.1029/2021MS002474

Imchen, Imsangla, et al. “Estimation of ocean mixed-layer depth using machine learning techniques.” Ocean Dynamics 75.6 (2025): 1-16.https://link.springer.com/article/10.1007/s10236-025-01708-0

 

发表回复