机器学习有助于绘制全球海洋社区的地图

在陆地上,显而易见的是,一个生态区域在哪里结束而另一生态区域在哪里开始,例如在沙漠和稀树草原之间的边界处。在海洋中,生命的大部分是 ...

在陆地上,一个生态区的结束和另一个生态区的开始是显而易见的,比如在沙漠和稀树草原的交界处。在海洋中,大多数生命都是微观的,流动性更大,这就要求科学家绘制生态独特的海洋区域之间的边界地图。

机器学习有助于绘制全球海洋社区的地图

科学家描述海洋群落的一种方法是通过叶绿素(浮游植物产生的绿色色素)的卫星图像。叶绿素浓度可以表明一个地区与另一个地区相比潜在生态系统的丰富程度或生产力。然而,叶绿素图只能给出给定区域可能存在的生命总量的信息。事实上,叶绿素浓度相同的两个区域,实际上可能有不同的动植物组合。

麻省理工学院开发的机器学习技术根据浮游植物物种之间的相互作用整理全球海洋数据,从而发现海洋位置之间的共性。利用这种方法,研究人员确定海洋可以分为100多个“省”和12个生态组成不同的“大省”。图片:由研究人员提供,麻省理工通讯社编辑。

“这就像你必须看一看陆地上所有生物量低的地区,包括南极洲和撒哈拉沙漠,即使它们的生态组合完全不同,”前博士后迈克索恩瓦尔德说。麻省理工学院地球、大气和行星科学系。

现在,麻省理工学院的Sonnewald和她的同事们开发了一种无监督的机器学习技术,可以自动整理出一组高度复杂的全球海洋数据,并根据其比例和各种浮游植物物种之间的相互作用找到海洋位置之间的共性。通过他们的技术,研究人员发现海洋可以分成100多个不同类型的“省”,具有不同的生态结构。可以想象,海洋中任何给定的位置都可以容纳这100个生态省中的一个。

然后,研究人员在这100个省份中寻找相似之处,最后将它们分成12个更一般的类别。从这些“大省”可以看出,一个地区虽然有些人的生活量相同,但是他们的群落结构或者说动植物物种的平衡却有很大的不同。索沃德说,捕捉这些生态微妙之处对于跟踪海洋的健康和生产力至关重要。

Sonnewald说,“生态系统随着气候变化而变化,需要监测群落结构,以了解对渔业和海洋吸收二氧化碳能力的影响。”“我们无法用传统方法完全理解这些生命力。到目前为止,那里的生态系统还没有被包括在内。但是我们的方法结合卫星数据和其他工具可以提供重要的进展。”

Sonnewald现在是普林斯顿大学的副研究员,也是华盛顿大学的访问学者,他在杂志《科学进展》上报道了这个结果。她在麻省理工学院的合著者是高级研究科学家Stephanie Dutkiewitz、首席研究工程师Christopher Hill和研究科学家Gael Forget。

推出数据球

该团队的新机器学习技术(他们称之为SAGE)用于系统地聚合生态省方法,旨在处理大型和复杂的数据集,并可能将数据投影到更简单的低维数据集。

“这就像做饼干一样,”索恩瓦尔德说。“你需要收集这些极其复杂的数据,并将其推出以揭示其元素。”

特别是,研究人员使用了Sonnewald所谓的聚类算法,该算法旨在“沿着数据集爬行”,并在点密度高的区域进行磨练——这表明这些点有共同点。

Sonnewald和她的同事在麻省理工学院达尔文项目的海洋数据上放宽了算法,这是一个全球海洋的三维模型,将海洋气候模型(包括风、流和温度模型)与海洋生态模型相结合。该模型包括51种浮游植物,以及每种植物的生长和相互作用模式以及与周围气候和有效养分的相互作用模式。

Sonnewald表示,如果人们试图浏览这个非常复杂的51层数据空间,以了解海洋中每个可用点的共同特征,那么这项任务将“人类难以处理”。使用团队的无监督机器学习算法,这种共性“开始变得清晰”。

该小组SAGE方法中的第一个“数据清洗”步骤能够将全球海洋分解为大约100个不同的生态区,每个生态区都有独特的物种平衡。

研究人员将海洋模型中的每个可用位置分配给100个省中的一个,并为每个省分配一种颜色。然后,他们生成了一张全球海洋地图,并按省份类型进行着色。

Sonwald说,“在南极洲周围的南大洋,在南极洲周围的这些带状条纹中,有勃艮第和橙色,它们塑造了我们对它们的期望。”“与其他函数一起,至少在模型中,这给了我们很大的信心,使我们的方法有效而有意义。”

生态统一

然后,研究小组寻找进一步简化他们确定的100多个省份的方法,看看他们是否能在这些生态不同的地区找到共同点。

“我们开始考虑类似的事情,如何将一群人彼此区分开?我们如何看待彼此之间的联系?我们使用这种直觉来看看我们是否可以量化不同省份在生态上的相似程度。”索纳瓦尔德说。

为此,研究小组运用图论技术,根据生物量,在一张图中代表了所有100个省。这类似于一个地区产生的叶绿素数量。他们选择将100个省分为12个大类,即“特大省”。当他们比较这些大型省份时,他们发现那些具有相似生物量的省份是由截然不同的生物物种组成的。

“例如,省D和K的生物量几乎相同,但是当我们深入研究时,K的硅藻几乎没有原核生物,而D的硅藻几乎没有,原核生物很多。但是从卫星看,它们看起来可能一样。”索纳瓦尔德说。“因此,我们的方法可以开始将生态信息添加到大量叶绿素措施中的过程,并最终有助于观察。”

该团队开发了一个在线小部件,研究人员可使用该小部件查找100个省之间的其他相似之处。在他们的论文中,Sonnewald的同事选择将这些省分为12类。但是其他人可能希望将省份划分为更多的组,并深入研究数据以查看这些组之间共有的特征。

索纳瓦尔德(Sonnewald)正在与海洋学家共享该工具,这些海洋学家希望精确确定特定生态组成的区域位于何处,因此,他们可以例如在这些区域而不是在物种平衡可能略有不同的其他区域中派遣船只进行采样。

“与其使用基于大量叶绿素的工具指导采样,并猜测使用此方法可以发现有趣的生态学,还不如说是外科手术,说,'这就是该模型在这里可能会发现的,'” Sonnewald说。“了解诸如海洋科学和全球渔业之类的物种组合的确非常重要。”

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 puzdycom@126.com 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022-07-05 01:19
下一篇 2022-07-05 01:20

相关推荐

发表回复

登录后才能评论
分享本页
返回顶部