Xin Zhiyuan报告编辑:Dinghui [Xin Zhiyuan简介] Google推出了新的Dolpingemma Big Model。在30年的海豚研究数据中训练的AI模型正在试图打破海豚语言密码。只有400m参数的轻质模型可以在常规像素手机上运行,不仅可以识别海豚声音模式,而且可以预测其下一个声音 - LLM预测下一个单词。您是否曾经谈论过神秘的海豚的神秘声音?现在,借助AI,可以在“人和海豚”之间实现跨物种的交流。 Google推出了一种创新的AI模型,称为Dolphatingemma,它不仅了解海豚的说法,而且还可以实时与海豚在水下进行交谈。听起来很科幻,但这是真的!看来人们会不到1%。 Dolphingemma是主要的LMM模型,但使用音频数据来训练来确定职业海豚结构并产生海豚,也是第一个LLM与动物交谈。 Google首席执行官还表示,Sundar Pichai“这是迈向实现跨物种交流的非常酷的一步。”同时,Pichai还宣布将在阳光下开放该型号。也许您可以将这种型号带到水族馆中,以展示您的超级大国。因为该型号很小,只有400m的尺寸,并且可以部署在手机上。扩展全文
几十年来,了解海豚脉搏的哨声和爆炸一直领先于科学。
如果您不仅可以听海豚,而且还可以完全理解它们的复杂沟通模式,您可以在人们与其他物种之间的沟通障碍吗?
海豚摧毁了沟通障碍
LLM可以预测下一个单词,而Dolphlingemma可以预测海豚想说的话。
Dolphatingemma使用Google独特的音频技术:声音段的声音很好地代表了海豚的声音。
然后通过建筑M处理这些声音ODEL适用于复杂的依从性。
Dolphingemma只有400m参数,可以直接部署到Google Pixel手机。
左:在第一次试验中,海豚形成吹口哨(左)和腕部爆炸(右)
Dolphingemma建立在Gemma建立的,Gemma是使用R&D和技术作为双子座模型的轻巧,最先进的开源模型。
类似于我们所熟悉的文本LLM,但是海豚是音频输入和音频输出的模型。
它可以处理自然对话-Dolphin的声音,以识别模式,结构,并最终预测可能的后续声音,因为LLM预测了下一个单词或令牌。
海豚数据集:WDP的数十年
这是与海豚“交谈”的困难任务。多亏了标有巨大的WDP标签,Cutch AI研究提供了独特的机会。
自1985年以来,WDP一直在全球进行长期已久的水下研究项目,进行代际。在特定的巴哈马社区中,在野生大西洋的研究中有惊人的海豚(Stenella Frontalis)的研究。
“在他们的世界中,在他们的途中”的非侵入性,主要的方法会产生丰富而独特的数据集。水下视频和音频的记录,数据已仔细地与单个海豚身份,生活史和观察行为进行了仔细的配对。
一群大西洋海豚,Stenella Frontalis
数十年来的WDP观察工作很重要。
最终目标是了解这些海豚声音的结构和潜在定义 - 寻找海豚语言的模式和政策。
自然通信的长期审查生成了WDP研究的基础,并为任何AI审查提供了重要的上下文数据。
左:一只女性不锈钢海豚在击打时观察了她的幼崽。完成活动后,他将使用他独特的签名哨子来打电话给幼崽。右:纪念海豚哨子的光谱图用像素手机与海豚交流
使用数据和模型是训练的,如何听到海豚的海豚?
WDP与佐治亚理工学院合作,形成了水下计算机的“鲸类听力增强遥测”系统。
聊天没有直接破译海豚的复杂自然语言,而是创造出更简单,共享的词汇。
通过在人们之间展示系统,研究人员希望海豚自然会好奇地学会模仿这些哨子,以要求他们想要的特定事物。
最终,随着越来越多的海豚理解其自然声音,也可以将它们添加到系统中。
新的聊天生成系统基于Google Pixel 9,集成了扬声器/麦克风功能并夺取高级电话处理功能。
使用像素的智能粉刺可以减少对定制硬件的需求,降低设备的成本和大小,并极大地促进了科学研究她可以研究高海的人。
最新聊天系统硬件中的Google Pixel 9
部署在移动电话上的海豚还可以帮助猜测聊天,并在第一次-dilthe -dolphin语音中识别潜在的模式。
跨物种通讯,AI完成并回到Sohu以查看更多
校园风采
>校区风采 Google AI已成功发射了海豚语,这是ChatGpt版本!交换人类跨物种的革命的开始
2025-04-18