阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳_实时热点_顺发之窗网(便民)
标王 热搜: 广州  SEO  贷款  深圳    医院  用户体验  网站建设  贵金属  机器人 
 
 
当前位置: 首页 » 资讯 » 实时热点 » 正文

阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

放大字体  缩小字体 发布日期:2025-01-29  来源:互联网  作者:顺发之窗网  
核心提示:农历除夕夜,全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后,是一场技术上的奇袭

农历除夕夜,全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后,是一场技术上的奇袭。

阿里除夕夜抛出重磅新模型

1月29日凌晨,阿里通义千问团队悄然上线了大模型Qwen2.5-Max,在多个权威基准测试中展现出与全球顶级模型比肩的性能。这是继DeepSeek之后,中国AI阵营在高性能、低成本技术路线上的又一重要突破。

阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

市场人士分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示,若阿里Qwen-2.5-max的性能超过V3,可以对其RL推理模型给予更大期待。

阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

当阿里云展现出“强大模型+充足算力+完整云平台”的组合优势时,是否印证了类似去年北美云计算服务商的投资逻辑?如果美股因AI整体增值10万亿美元,中国AI资产的重估时机是否已至?

Qwen2.5-Max采用超大规模MoE(混合专家)架构,基于超过20万亿token的预训练数据。在MMLU-Pro、LiveCodeBench、LiveBench以及Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。阿里团队表示,随着后训练技术的进步,下一个版本将有望达到更高水平。

Qwen2.5团队同步发布了两个创新型号:Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口,成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力,处理百万token输入的速度比传统方法快3到7倍,输出长度可达8000个token。

原标题:阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳


 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。顺发之窗网对此不承担任何保证责任。如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!
[ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
推荐图文
推荐资讯

 
网站首页 | 付款方式 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | RSS订阅 | 网站索引
免责声明:本站所有信息均来自互联网,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!顺发之窗网对此不承担任何相关法律责任!
友情提示:买产品需谨慎 网站信息处理与建议邮箱:sfzcw@qq.com