4月3日消息,有消息称阿里即将在2025年4月第二周发布新模型Qwen3,这将是阿里在2025年上半年最重要的模型产品。消息还称,DeepSeek-R1发布后,阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。

去年9月19日,阿里云CTO周靖人在2024云栖大会上发布通义千问新一代开源模型Qwen2.5,强化多轮对话与复杂任务处理能力,显著提升生成质量与逻辑连贯性‌。其中Qwen2.5-72B-Instruct版本在Chatbot Arena盲测中位列全球前十,成为首个进入该榜单的中国模型‌。

公开信息显示,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。(宜月)

本文来源于极客网,原文链接: https://www.fromgeek.com/internet/50-680797.html

分类: 暂无分类 标签: 暂无标签

评论