春节档AI唱主角 国产大模型密集更新 开源模型展现强劲势头_奇闻异事_顺发之窗网(便民)
标王 热搜: 广州  SEO  贷款  深圳    医院  用户体验  网站建设  贵金属  机器人 
 
 
当前位置: 首页 » 资讯 » 奇闻异事 » 正文

春节档AI唱主角 国产大模型密集更新 开源模型展现强劲势头

放大字体  缩小字体 发布日期:2025-01-29  来源:互联网  作者:顺发之窗网  
核心提示:春节期间,中国的大模型技术迎来了一波密集更新

春节期间,中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,预训练数据超过20万亿tokens,在多个基准测试中表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。新模型发布后,阿里巴巴美股大涨6.76%。此前一天,通义千问还开源了全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本,能够更准确地解析图像内容,支持超1小时的视频理解,实现给指定朋友送祝福、电脑修图、手机订票等操作。

春节档AI唱主角 国产大模型密集更新

同样在1月28日,DeepSeek团队发布了两款多模态框架——Janus-Pro和JanusFlow。其中,Janus-Pro是统一多模态理解与生成的创新框架,其在图像生成基准测试中的表现超越了OpenAI的“文生图”模型DALL·E 3,并选择了开源。

春节档AI唱主角 国产大模型密集更新 开源模型展现强劲势头

目前,国内外厂商在开闭源路线上各有侧重。例如,OpenAI的GPT-4模型采用闭源模式,而meta选择完全开源。其他大模型公司则将低参数量的模型开源,高参数量的模型闭源。DeepSeek和阿里云通义团队都是开源路线的坚持者,此次DeepSeek的成功也被认为是开源模型的胜利。

春节档AI唱主角 国产大模型密集更新 开源模型展现强劲势头

meta首席人工智能科学家Yann LeCun表示,DeepSeek之所以一鸣惊人,是因为他们从开放研究和开源中获益。他们的工作是公开发布和开源的,每个人都可以从中受益,这就是开放研究和开源的力量。一位大模型青年学者也认为,开源和闭源路线各有特色,但开源更能促进行业发展。云基础设施厂商有望受益于这次开源的胜利,这也是阿里云通义大模型坚持开源路线的原因之一。

原标题:春节档AI唱主角 国产大模型密集更新 开源模型展现强劲势头


 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。顺发之窗网对此不承担任何保证责任。如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!
[ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
推荐图文
推荐资讯

 
网站首页 | 付款方式 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | RSS订阅 | 网站索引
免责声明:本站所有信息均来自互联网,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!顺发之窗网对此不承担任何相关法律责任!
友情提示:买产品需谨慎 网站信息处理与建议邮箱:sfzcw@qq.com