谷歌发布小钢炮模型Gemma 3n:2GB内存本地玩转AI多模态,掀起AI新革命!

随着科技的飞速发展,谷歌再次引领行业潮流,发布了全新的Gemma 3n端侧多模态模型。这款模型以其强大的性能和卓越的灵活性,无疑将在AI领域掀起一场新的革命。

Gemma 3n是一款支持在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型的多模态模型。相较于前不久发布的预览版,其完整版在性能表现上有了显著提升,重点提升了编码和推理方面的能力。不仅如此,Gemma 3n还提供了两种规模版本,以满足不同硬件设备的需求。

在架构方面,Gemma 3n创新采用了MatFormer架构,通过一个较大模型内部包含一个较小但完全功能的版本,让单一模型能够根据不同任务以不同大小运行。这种架构的运用,极大地提升了模型的计算灵活性。此外,Gemma 3n还使用了Per Layer Embeddings(PLE)以提升内存效率,以及MobileNet-v5视觉编码器等创新技术。

值得一提的是,Gemma 3n在多语言(支持140种语言的文本和35种语言的多模态理解)、数学、编码和推理方面都实现了质量提升。这一全面的能力提升,使其在各种场景下都能展现出卓越的性能。

在性能基准方面,Gemma 3n的较大模型E4B是首个参数量低于10B但LMArena得分超过1300的模型,这无疑证明了其在性能上的领先地位。而模型的音频能力现在更是支持设备上的语音转文本和翻译,使用一个能够处理细致语音的编码器。视觉方面则由一个名为MobileNet-V5的新编码器提供动力,比前代更快、更高效。它能在Google Pixel设备上以最高60FPS处理视频。

更令人振奋的是,Gemma 3n能够在2GB内存的硬件上本地运行,这无疑为更多的用户提供了广阔的应用空间。在当今的移动设备日益普及的时代,这样的设计无疑更能满足广大用户的需求。

总的来说,谷歌发布的Gemma 3n端侧多模态模型无疑是一款具有划时代意义的作品。它以强大的性能和卓越的灵活性,为AI领域带来了新的革命。未来,我们期待Gemma 3n能在更多的应用场景中发挥其卓越的性能,为人们的生活带来更多的便利和乐趣。正如谷歌所宣称的那样,“2GB内存本地玩转AI多模态”,这无疑是对Gemma 3n强大性能的最佳诠释,也预示着AI技术将在未来得到更广泛的应用和普及。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

本文来源于极客网,原文链接: https://www.fromgeek.com/ai/693848.html

分类: 暂无分类 标签: 暂无标签

评论