阿里巴巴发布 Qwen 2.5,宣称超越 DeepSeek-V3
阿里巴巴发布 Qwen 2.5,宣称超越 DeepSeek-V3,掀起 AI 竞争新高潮。DeepSeek 崛起引发价格战,各大科技公司竞相应对,行业格局或将重塑。
阿里巴巴近日发布了其最新 AI 模型 Qwen 2.5,并宣称该模型在多个维度上超越了广受好评的 DeepSeek-V3。这一消息引发业界热议,尤其是 Qwen 2.5 选择在大年初一发布,显得格外不同寻常。就在全国人民正沉浸在春节假期时,阿里却抢先公布这一重要进展,似乎在回应 DeepSeek 近几周的爆炸式增长所带来的压力。DeepSeek 的崛起不仅震动了海外同行,也让国内科技巨头们感受到了前所未有的竞争压力。
阿里巴巴云计算部门在官方微信账号上发布公告称:“Qwen 2.5-Max 在几乎所有方面都优于 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。”这意味着,Qwen 2.5 并不仅仅针对 DeepSeek,而是将矛头直指 OpenAI 和 Meta 旗下最先进的开源 AI 模型。
DeepSeek 自 1 月 10 日推出 DeepSeek-V3,并在 1 月 20 日发布 R1 模型后,迅速成为全球 AI 领域的焦点。这家中国 AI 初创企业不仅以惊人的发展速度震撼硅谷,还一度导致科技股大跌。更让投资者担忧的是,DeepSeek 的低成本开发模式和极具竞争力的使用价格,动摇了美国 AI 领军企业的巨额研发预算。
DeepSeek 的成功让国内同行坐不住了。就在 R1 发布两天后,TikTok 母公司字节跳动迅速更新了其旗舰 AI 模型,并声称在 AIME 评测中超越了微软支持的 OpenAI o1 模型。值得注意的是,DeepSeek 也曾宣称其 R1 模型在多个关键指标上与 OpenAI o1 旗鼓相当。
DeepSeek 过去的每一次升级,都在中国 AI 赛场上掀起价格战。2023 年 5 月,DeepSeek-V2 发布后,由于其开源且极低的使用成本(仅 1 元/百万 tokens),阿里云不得不紧急宣布对多个 AI 模型降价,最高降幅达 97%。这一举动引发了连锁反应,百度、腾讯等国内科技巨头纷纷跟进,ChatGPT 在中国的竞品也不断涌现。
然而,DeepSeek 创始人梁文峰在 7 月接受国内媒体《浪潮》采访时表示,他对价格战毫不在意,公司的终极目标是实现通用人工智能(AGI)。按照 OpenAI 的定义,AGI 是指能在大多数经济价值较高的任务中超越人类的自主系统。
与阿里这样拥有数十万员工的科技巨头不同,DeepSeek 的组织架构更像是一个研究实验室,核心团队主要由国内顶尖高校的年轻硕士和博士生组成。梁文峰在 7 月的采访中表示,他认为中国的大型科技公司未必适合未来的 AI 产业。他直言,这些公司高昂的成本和自上而下的管理方式,与 DeepSeek 精简高效的团队运作模式形成了鲜明对比。
“基础大模型需要持续创新,而科技巨头的能力终究是有限的。”梁文峰说道。DeepSeek 未来能否打破行业格局,成为中国 AI 领域的领导者,仍然有待观察。但可以确定的是,它的崛起已经让整个 AI 产业加速变革,未来竞争将更加激烈。
本文译自 Reuters,由 BALI 编辑发布。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )
本文来源于极客网,原文链接: https://www.fromgeek.com/ai/670892.html
本网站的所有内容仅供参考,网站的信息来源包括原创、供稿和第三方自媒体,我们会尽力确保提供的信息准确可靠,但不保证相关资料的准确性或可靠性。在使用这些内容前,请务必进一步核实,并对任何自行决定的行为承担责任。如果有任何单位或个人认为本网站上的网页或链接内容可能侵犯其知识产权或存在不实内容,请及时联系我们沟通相关文章并沟通删除相关内容。
评论