据谷歌新闻稿,谷歌公司一直致力于开发用于识别鲸鱼声音的人工智能模型。最新的多物种鲸鱼声音模型能够准确识别8种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。
这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式。目前,该模型已公开供学术人员下载使用。
谷歌公司自2018年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从而成功获得了相关鲸群在特定时间地点的鸣叫规律,并借此发现了鲸群新栖息地。
此外,谷歌还与加拿大渔业及海洋部(DFO)、Rainforest Connection合作,针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型,并将其应用于水下麦克风监测网络,能够实时报告虎鲸的位置给DFO和其他单位。
考虑到鲸鱼声音覆盖频率范围极广(例如蓝鲸发声为10 Hz低频、齿鲸发声为120 kHz高频),因此该模型在科研层面可谓创举。研究人员首先将原始音频转换为时频谱(Spectrogram)以作为模型识别声音的基础,每个时间窗包含5秒钟的声音片段。接着,梅尔刻度法调整这些时频谱的声音频率,并通过压缩和正则化突出声音特征,进而将其分类为不同种类的鲸鱼鸣叫类别。
由于海中存在各种声音,研究人员还加入了大量背景声音来训练模型,以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示该鲸鱼声音识别模型能够良好地区分不同种类的鲸鱼,特别是小须鲸和布氏鲸的声音。
评论