新闻资讯
新闻资讯

阿里巴巴发布了新一代的Qianwen 3型号,所有这些

北京新闻贝克金融(记者lu Yidan)在4月29日清晨,开放的阿里巴巴新一代新一代tongyi Qianwen型号Qwen3(定义为Qianwen3),参数量仅为DeepSeek-R1的1/3,成本下降了,并且性能大幅下降,并且性能率是新的模型中的不同模型中的不同模型。 Beike News Beike Finance的一名记者发现,与其他大型型号相比,其界面布局具有创新性。例如,可以选择深层思考来通过拖动“时间轴”按钮来控制最大心态,从而控制令牌的消耗预算(计算能力单位)。此外,它还在搜索框中添加了最近仅热的“ MCP”(模型上下文协议)选项,但似乎是“释放”。在Qianwen3接口的屏幕截图中,您将看到“预算预算”控制按钮和MCP的性能。 Qianwen3采用了混合专家(MOE)的建筑,235b的参数总量,并且只需要22B即可激活它。 36T和许多强化研究都被给予训练后阶段,这是无缝整合不是心理模型的模式。马克甚至超过了Grok3;性能大大提高,扩大Qianwen 3的成本也大大下降了。只能使用4 H20来部署Qianwen 3全样版本,而视频记忆消耗仅为具有相似性能的模型的三分之一。此外,Qianwen3还提供了该模型的丰富版本,包括230B和235B MOE型号,以及6种密集型型号,例如0.6B,1.7B,4B,4B,8B,14B,32B等。QWEN2.5-32B模型性能; Qianwen3的密集性能继续破坏,一半的参数可以达到相同的高性能,因为Qianwen3模型的32B版本可以超过Qwen2.5-72B的级别。它为扩展应用程序提供了舒适感。例如,4B模型是一个很棒的SIZE用于手机; 8B模型可用于在计算机和车辆上部署应用程序; 32B车型在大型扩张公司中最受欢迎。当前,Qianwen 3系模型仍然使用Loose Apache 2.0协议首次打开资源并支持119种语言。全球开发人员,研究和商业机构可以在摩德户社区(Modai Community)和拥抱面(Huggingface)的平台上免费下载和使用模型,并免费用于商业用途。单个用户可以通过Thyi应用程序立即体验Qianwen 3,并且Quark与Qianwen 3紧密相连。据报道,阿里巴巴·塔利(Alibaba Talyi)已开设了200多个型号,全球下载了3亿多个型号,超过100,000个Qianwen的Qianwen模型超过了美国的美国,成为了美国开放资源的数量。编辑koudna校对刘jun