打破蒸馏质疑!梁文锋论文登上《自然》封面

安然网9月18日消息,据媒体报道,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,近日登上国际顶级学术期刊《自然》(Nature)的封面,引发广泛关注。

与今年1月发布的初版论文相比,本次正式发表的版本披露了更多模型训练的技术细节,并对发布初期外界有关“蒸馏”方法的质疑作出了正面回应。

DeepSeek-R1也因此成为全球首个经过严格同行评审的主流大语言模型。《自然》在评论中指出,当前绝大多数主流大模型尚未经过独立的同行评审,而这一重要空白“终于被DeepSeek打破”。

公开资料显示,DeepSeek创始人梁文锋毕业于浙江大学电子信息与通信工程专业,获本科及硕士学位。他于2023年7月创立DeepSeek,公司在2024年5月推出DeepSeek-V2,同年12月27日发布DeepSeek-V3。

2025年1月20日,DeepSeek正式发布DeepSeek-R1模型。该模型犹如一颗投入平静湖面的巨石,在国际AI界激起千层浪,不仅颠覆了“AI研发必须高投入、长周期”的传统认知,也打破了美国在AI领域的话语垄断。

打破蒸馏质疑!梁文锋论文登上《自然》封面

【本文结束】如需转载请务必注明出处:安然网

责任编辑:鹿角

文章内容举报

– THE END –

0
分享海报

评论0

请先
欢迎您光临安然网,如有侵权,请提供相关版权证明发给本站,审核属实后将会立即删除。MAIL:zgs5516@163.com
显示验证码
没有账号?注册  忘记密码?

社交账号快速登录

'); })();