谷歌发布革命性 Gemma 3n 端侧多模态模型:小内存也能轻松驾驭 AI,开启全新智能时代!

在近日举行的 2025 年 I/O 开发者大会上,谷歌推出了一款名为 GEMMA 3n 的端侧多模态 AI 模型,这款模型可以在手机、平板和笔记本电脑等设备上本地运行,处理音频、文本、图片和视频等多种数据类型。这一创新性举措无疑将为 AI 在移动设备领域的应用开启全新的篇章。

首先,让我们来了解一下 GEMMA 3n 的技术特点。据 Gemma 产品经理 Gus Martins 透露,Gemma 3n 采用了一种与 Gemini Nano 同款架构,但性能表现更为出色。这款模型可以在内存小于 2GB 的设备上运行,这无疑是一个巨大的突破。同时,Gemma 3n 还采用了谷歌 DeepMind 开发的 Per-Layer Embeddings(PLE)技术,这一技术显著降低了模型的内存需求,使得这款模型在有限的内存条件下也能表现出色。

除了技术上的突破,Gemma 3n 在性能方面也有显著的提升。通过 PLE、KVC 共享和高级激活量化等技术,Gemma 3n 在移动设备上的响应速度提升了一倍以上,这无疑将大大提升用户的使用体验。此外,Gemma 3n 的质量也优于 Gemma 3 4B 版本,这进一步证明了谷歌在 AI 技术方面的领先地位。

值得一提的是,Gemma 3n 在非英语语言处理上也有了突破。该模型在日语、德语、韩语、西班牙语和法语等语言中的表现尤为出色。在多语言基准测试 WMT24++ 中,Gemma 3n 的得分高达 50.1%,这一成绩令人瞩目。这意味着 GEMMA 3n 有望在跨语言翻译、语音识别等领域发挥重要作用。

那么,如何使用 GEMMA 3n 呢?目前,用户无需任何设置,只需通过 Google AI Studio 直接在浏览器中使用即可。而对于开发者而言,他们可以通过 Google AI Edge 集成本地功能,支持文本和图像理解与生成,未来还将扩展更多能力。这一开放的接入方式无疑将吸引更多的开发者参与到 GEMMA 3n 的开发与应用中来。

GEMMA 3n 的发布无疑将为移动设备领域的 AI 应用带来革命性的变化。在内存有限的条件下,小内存也能轻松驾驭 AI,这无疑将为更多的用户提供更为便捷、高效的 AI 服务。此外,GEMMA 3n 在非英语语言处理方面的突破也将为全球范围内的语言服务带来革新。

总的来说,GEMMA 3n 的发布是谷歌在 AI 技术领域的一次重大突破,也是谷歌致力于推动 AI 技术在各个领域应用的体现。随着 GEMMA 3n 的广泛应用和普及,我们有望进入一个全新的智能时代。在这个时代里,AI 将无处不在,为我们的生活带来更多的便利和可能。我们期待着 GEMMA 3n 在未来能够带来更多的惊喜和突破。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

本文来源于极客网,原文链接: https://www.fromgeek.com/ai/687268.html

分类: 暂无分类 标签: 暂无标签

评论