“AI界拼多多”DeepSeek V3发布App版-新快网-新快报官方网站

“AI界拼多多”DeepSeek V3发布App版
日期:[2025-01-15] 版次:[A15] 版名:[数智周刊] 字体:【大中小】

一起了解更多数智资讯

国民免费用上顶级大模型

新快报讯记者郑志辉报道中国AI业界开年最振奋人心的一则消息，莫过于杭州大模型创业公司“深度求索”DeepSeek发布的最新V3开源模型，评测成绩不仅超越了Qwen2.5-72B（阿里自研大模型）和Llama 3.1-405B（Meta自研大模型）等当前领先开源模型，甚至能和GPT-4o、Claude 3.5-Sonnet（Anthropic自研大模型）等顶级闭源模型掰掰手腕。

更难得的是，有数据显示，OpenAI GPT-4训练成本高达6300万美元，而DeepSeek-V3成本只有其十分之一不到。

1月13日，DeepSeek官方应用上线苹果App Store，结合两大核心功能：深度思考和联网搜索，支持用户完成对话、语言翻译、创意写作、编程、解题、文献解读、旅行规划等用途，比网页版多了“拍照识文字”功能，但依然是免费的，被中外网友评价为：ChatGPT最佳免费替代品之一。

天才年轻团队打造

公开信息显示，DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的，这一数量远低于硅谷大厂普遍使用的几十万块更高性能的GPU。这一成就打破了算力芯片对国产大模型的限制瓶颈，为创业团队提供了新的解法：即便在算力有限的情况下，使用高质量数据和更好的算法，同样能训练出高性能大模型。

DeepSeek的母公司是梁文锋在2015年创立、量化基金起家的幻方量化。80后梁文锋本科、研究生都就读于浙江大学，拥有信息与电子工程学系本科和硕士学位。

2017年，幻方量化宣称实现投资策略全面AI化。2019年，其资金管理规模超100亿元，也一度是国内首家突破千亿私募的量化大厂。2023年5月，梁文锋实控的AI研发机构北京“深度求索”成立，次年DeepSeek正式上线。

DeepSeek团队最大的特点就是年轻。应届生、在读生，特别是来自清北的应届生在其中非常活跃。他们中的一些人，2024年一边在DeepSeek搞研究，另一边新鲜热乎的博士学位论文刚评上奖。

就在DeepSeek在X平台被海外AI技术大牛发帖背书后，小米的一则挖角消息迅速在中文互联网刷屏——小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉，领导小米AI大模型团队。

而罗福莉曾在知乎发表对DeepSeek团队的评价：DeepSeek团队的每一个人都非常优秀，DeepSeek-V2是群体智慧的结晶，创始人也是我坚信的国内最适合技术驱动型创业的。

实测：不宜过高评价

在DeepSeek V3的一夜成名后，广发证券计算机行业分析师发布研报称：“为了深入探索DeepSeek-V3的能力，我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试，将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”

测试结果显示，DeepSeek-V3总体能力与其他大模型相当，但在逻辑推理和代码生成领域具有自身特点。例如，在密文解码任务中，DeepSeek-V3是唯一给出正确答案的大模型；而在代码生成的任务中，DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面，DeepSeek-V3并未展现出明显优于其他大模型之处。

数码博主雷科技做了四轮测试，得到以下结论——常规问答：简短整洁、可读性高；内容总结：结果很精简，重点有缺失；数学题解答：快速、准确、有过程；金融问题答疑：精准理解，给出了适当建议。

最后，他总结说，对于以文字生成为主要需求的用户来说，DeepSeek-V3是一款不错的AI大模型，但若有更多需求，如写长篇小说、创作图片、投资计算，豆包、Kimi等免费服务的AI大模型及其提供的智能体或许更合适。

DCCI未来智库与未来实验室首席专家胡延平发文表示，实测下来基本可以，数学正确率较高，代码是强项，考验模型的一些经典问题，回答正确与错误参半，还没遇到其他用户反馈的不稳定、思路循环紊乱问题。但目前的V3只是在资源和性能之间调优取得最佳平衡，没有底层原理创新，不宜过高评价。

分享到：

　　以上内容版权均属广东新快报社所有（注明其他来源的内容除外），任何媒体、网站或个人未经本报协议授权不得转载、链接、转贴或以其他方式复制发布/发表。

本报新闻今日排行榜