亚马逊云科技上线Qwen3与DeepSeek-V3.1,技术细节首次公开
亚马逊云科技近日宣布,在 Amazon Bedrock 平台上正式上线由阿里巴巴和深度求索(DeepSeek)推出的五款开放权重模型,包括 Qwen3 系列的四个模型及 DeepSeek-V3.1。这是继年初 DeepSeek-R1 上架后,Amazon Bedrock 再次引入由中国技术团队开发的大模型,也是 Qwen 系列首次登陆该平台。
此次上架的模型针对不同应用场景进行了专门优化。Qwen3-Coder-480B-A3B-Instruct 和 Qwen3-Coder-30B-A3B 主要面向复杂软件工程任务,支持多语言代码生成、理解和高级 Agent 任务,具备调用外部工具和应用程序的能力。Qwen-3-235B-A22B-Instruct-2507 作为通用推理模型,采用混合专家(MoE)架构,在代码、数学和通用推理任务中表现优异,同时兼顾性能与效率。Qwen3-32B(Dense)则适用于计算资源受限或对性能稳定性要求较高的场景。
值得关注的是,Qwen3-Coder-30B-A3B-Instruct 和 Qwen3-235B-A22B-Instruct-2507 支持高达 262K token 的上下文长度,相当于单次处理约 20 万字符或两部长篇小说的内容。DeepSeek-V3.1 拥有 6850 亿参数,每次任务仅调用相关知识部分,在提升推理能力和 Agent 技能的同时优化了运行成本。该模型在多语言处理、软件开发、数学推理和数据分析方面表现突出,尤其适用于构建 AI Agent 和流程自动化任务。
亚马逊云科技强调,开放权重模型在透明度与可定制性方面具备显著优势。客户可基于自身需求对模型权重进行调整,并通过二次训练实现更灵活的适配。此外,这些模型已集成 Amazon Bedrock 的企业级功能,包括数据加密、访问控制、Amazon Bedrock Guardrails 防幻觉机制等,确保客户数据隐私与合规要求得到满足。
Amazon Bedrock 总监 Luis Wang 表示,开放权重模型代表 AI 创新的重要方向,亚马逊云科技致力于为客户提供安全、可扩展且成本效益显著的模型运行环境。大中华区产品部总经理陈晓建指出,此次发布进一步丰富了平台模型选择,更好地服务全球客户。技术总监王晓野补充道,与仅提供模型下载的平台不同,Amazon Bedrock 更注重将模型集成至生产环境,提供端到端的企业级支持。
截至目前,Amazon Bedrock 已提供超过一百个基础模型,涵盖开源和商业类型。未来,亚马逊云科技将继续扩展模型阵容,为全球客户提供更丰富、更多元的生成式 AI 解决方案。
(注:本文在资料搜集、框架搭建及部分段落初稿撰写阶段使用了 AI 工具,最终内容经人类编辑核实事实、调整逻辑、优化表达后完成。)
本文来源于极客网,原文链接: https://www.fromgeek.com/latest/704265.html
本网站的所有内容仅供参考,网站的信息来源包括原创、供稿和第三方自媒体,我们会尽力确保提供的信息准确可靠,但不保证相关资料的准确性或可靠性。在使用这些内容前,请务必进一步核实,并对任何自行决定的行为承担责任。如果有任何单位或个人认为本网站上的网页或链接内容可能侵犯其知识产权或存在不实内容,请及时联系我们沟通相关文章并沟通删除相关内容。
评论