站内搜索:
“AI界拼多多”DeepSeek V3发布App版
日期:[2025-01-15]  版次:[A15]   版名:[数智周刊]   字体:【

一起了解更多 数智资讯

国民免费用上顶级大模型

新快报讯 记者郑志辉报道 中国AI业界开年最振奋人心的一则消息,莫过于杭州大模型创业公司“深度求索”DeepSeek发布的最新V3开源模型,评测成绩不仅超越了Qwen2.5-72B(阿里自研大模型)和Llama 3.1-405B(Meta自研大模型)等当前领先开源模型,甚至能和GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等顶级闭源模型掰掰手腕。

更难得的是,有数据显示,OpenAI GPT-4训练成本高达6300万美元,而DeepSeek-V3成本只有其十分之一不到。

1月13日,DeepSeek官方应用上线苹果App Store,结合两大核心功能:深度思考和联网搜索,支持用户完成对话、语言翻译、创意写作、编程、解题、文献解读、旅行规划等用途,比网页版多了“拍照识文字”功能,但依然是免费的,被中外网友评价为:ChatGPT最佳免费替代品之一。

天才年轻团队打造

公开信息显示,DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的,这一数量远低于硅谷大厂普遍使用的几十万块更高性能的GPU。这一成就打破了算力芯片对国产大模型的限制瓶颈,为创业团队提供了新的解法:即便在算力有限的情况下,使用高质量数据和更好的算法,同样能训练出高性能大模型。

DeepSeek的母公司是梁文锋在2015年创立、量化基金起家的幻方量化。80后梁文锋本科、研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位。

2017年,幻方量化宣称实现投资策略全面AI化。2019年,其资金管理规模超100亿元,也一度是国内首家突破千亿私募的量化大厂。2023年5月,梁文锋实控的AI研发机构北京“深度求索”成立,次年DeepSeek正式上线。

DeepSeek团队最大的特点就是年轻。应届生、在读生,特别是来自清北的应届生在其中非常活跃。他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。

就在DeepSeek在X平台被海外AI技术大牛发帖背书后,小米的一则挖角消息迅速在中文互联网刷屏——小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。

而罗福莉曾在知乎发表对DeepSeek团队的评价:DeepSeek团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的。

实测:不宜过高评价

在DeepSeek V3的一夜成名后,广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”

测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。

数码博主雷科技做了四轮测试,得到以下结论——常规问答:简短整洁、可读性高;内容总结:结果很精简,重点有缺失;数学题解答:快速、准确、有过程;金融问题答疑:精准理解,给出了适当建议。

最后,他总结说,对于以文字生成为主要需求的用户来说,DeepSeek-V3是一款不错的AI大模型,但若有更多需求,如写长篇小说、创作图片、投资计算,豆包、Kimi等免费服务的AI大模型及其提供的智能体或许更合适。

DCCI未来智库与未来实验室首席专家胡延平发文表示,实测下来基本可以,数学正确率较高,代码是强项,考验模型的一些经典问题,回答正确与错误参半,还没遇到其他用户反馈的不稳定、思路循环紊乱问题。但目前的V3只是在资源和性能之间调优取得最佳平衡,没有底层原理创新,不宜过高评价。

分享到:
  以上内容版权均属广东新快报社所有(注明其他来源的内容除外),任何媒体、网站或个人未经本报协议授权不得转载、链接、转贴或以其他方式复制发布/发表。