亚马逊云科技近日宣布,在 Amazon Bedrock 平台上正式上线由阿里巴巴和深度求索(DeepSeek)推出的五款开放权重模型,包括 Qwen3 系列的四个模型及 DeepSeek-V3.1。这是继年初 DeepSeek-R1 上架后,Amazon Bedrock 再次引入由中国技术团队开发的大模型,也是 Qwen 系列首次登陆该平台。

此次上架的模型针对不同应用场景进行了专门优化。Qwen3-Coder-480B-A3B-Instruct 和 Qwen3-Coder-30B-A3B 主要面向复杂软件工程任务,支持多语言代码生成、理解和高级 Agent 任务,具备调用外部工具和应用程序的能力。Qwen-3-235B-A22B-Instruct-2507 作为通用推理模型,采用混合专家(MoE)架构,在代码、数学和通用推理任务中表现优异,同时兼顾性能与效率。Qwen3-32B(Dense)则适用于计算资源受限或对性能稳定性要求较高的场景。

值得关注的是,Qwen3-Coder-30B-A3B-Instruct 和 Qwen3-235B-A22B-Instruct-2507 支持高达 262K token 的上下文长度,相当于单次处理约 20 万字符或两部长篇小说的内容。DeepSeek-V3.1 拥有 6850 亿参数,每次任务仅调用相关知识部分,在提升推理能力和 Agent 技能的同时优化了运行成本。该模型在多语言处理、软件开发、数学推理和数据分析方面表现突出,尤其适用于构建 AI Agent 和流程自动化任务。

亚马逊云科技强调,开放权重模型在透明度与可定制性方面具备显著优势。客户可基于自身需求对模型权重进行调整,并通过二次训练实现更灵活的适配。此外,这些模型已集成 Amazon Bedrock 的企业级功能,包括数据加密、访问控制、Amazon Bedrock Guardrails 防幻觉机制等,确保客户数据隐私与合规要求得到满足。

Amazon Bedrock 总监 Luis Wang 表示,开放权重模型代表 AI 创新的重要方向,亚马逊云科技致力于为客户提供安全、可扩展且成本效益显著的模型运行环境。大中华区产品部总经理陈晓建指出,此次发布进一步丰富了平台模型选择,更好地服务全球客户。技术总监王晓野补充道,与仅提供模型下载的平台不同,Amazon Bedrock 更注重将模型集成至生产环境,提供端到端的企业级支持。

截至目前,Amazon Bedrock 已提供超过一百个基础模型,涵盖开源和商业类型。未来,亚马逊云科技将继续扩展模型阵容,为全球客户提供更丰富、更多元的生成式 AI 解决方案。

(注:本文在资料搜集、框架搭建及部分段落初稿撰写阶段使用了 AI 工具,最终内容经人类编辑核实事实、调整逻辑、优化表达后完成。)

本文来源于极客网,原文链接: https://www.fromgeek.com/latest/704265.html

分类: 暂无分类 标签: 暂无标签

评论