陆首群评 DeepSeek


DeepSeek获得最大的成功是梁文锋团队以创新的姿态研发出一条“低投资低成本有限资源,高效率,高性价比(产出)”发展人工智能的新路径。

DeepSeek堪称为当前中国人工智能的代表作,正在改变世界人工智能的发展格局。

*打击美国在人工智能领域的霸权,

*为中国发展人工智能开辟了康庄大道,

*否定美西方以“巨额投资高成本海量资源,低效率,低性价比(产出)”发展人工智能的老路。

称梁文锋团队是一群奇才或天才,实现了“国运式”的创新,并不为过!

梁文锋团队坚持开源创新,开源有助于人工智能的迭代创新维稳升级开拓生态;DeepSeek将大模型C端全开源和B端实行开源商业模式铸成一体,不但有实行开源创新,并可支持开源产业的发展,这也是DeepSeek一大创造。

按现行产出产品排行榜排队,有人以此来打压DeepSeek,其实DeepSeek与其他生成式语言大模型的产出性能处于对等状态,不存在过分夸张的你高我低情况,如以更科学的性价比对比,DeepSeek肯定是天下第一。

目前DeepSeek的主要技术没有多少秘密可言,国内外一些生成式语言大模型基本上也将DeepSeek的主要技术学到了手,在开展下一阶段人工智能竞赛时,可以说大家处于同一起跑线上。

目前DeepSeek大模型像其他大模型一样都是一种生成式自回归语言大模型,DeepSeek也不可避免存在语言大模型那些局限性和负面缺陷,影响到DeepSeek在发展中要克服局限根治缺陷大幅度提升智能节能增效,并扩大应用。

对生成式自回归语言大模型而言,由于语言不能取代世界,因而它缺乏世界知识,或者不能产生新知,无法真正理解物理世界,加上语言不等于思维,它在运行时也限制了思维深度,最终限制了产出的智能水平;语言大模型训练架构的自回归机制是基于Tokens及其支持的信号处理和统计学,这是产生幻觉的根源。

DeepSeek像其他标准的普惠的基座模型一样,难以直接转变为企业行业的优质生产力,尚需提升其暂时缺失的商业价值,它们对企业行业是缺乏深度理解的,它们真的在落入企业行业(如金融制造医疗等),要产生企业行业的价值,必须把企业行业的数据抓起来,进而进行应用补缺。

十一建议DeepSeek发展的重要任务是解决其纠偏转轨问题,力争在全球白热化竞赛中制胜。

十二DeepSeek纠偏转轨的目标是研发真实的先进的人工智能——通用人工智能(AGI)。研发AGI切忌急功近利,而欲达AGI先要研发过渡阶段AI的任务(如多模态具身Agents和世界模型等),AGI是一个具有自主系统的AI,AGI正处于AI的智能是否可能超越人类的十字路口,这关系到是否影响人类的安全,甚至影响到人类能否在地球上生存极端严重的问题,在研发AGI以保障人类安全的预防措施时,还要求全球各国在相互增进信任的基础上进行统一行动,并实行技术管理(监管)并举的方针,任务极其严峻和艰巨。

英文版:https://www.oschina.net/news/355188/lu-shouquns-view-of-deepseek-en


相關推薦

2025-06-14

“陆主席评DeepSeek”(英文版)在Hugging Face上发表了! 链接:https://huggingface.co/blog/COPU2004/lu-shouquns-view-of-deepseek 以下为英文版全文: Honorary Chairman of China OSS (Open Source Software) Promotion Union (COPU) Abstract DeepSeek can be seen as a repres

2023-04-19

。 赛事评审委员会邀请了倪光南(中国工程院院士)、陆首群(中国开源软件推进联盟名誉主席)、吾守尔(中国工程院院士)、郑纬民(中国工程院院士)、廖湘科(中国工程院院士)、王怀民(中国科学院院士)助阵。通

2025-03-27

DeepSeek-V3 模型近日进行了更新,虽然大家都说更新后的 DeepSeek-V3-0324 强到没边——哪怕叫 DeepSeek V3.5 也不为过,但官方仍低调地称其是“小版本升级”。 下面是官方针对 DeepSeek-V3-0324 发布的更新说明。 DeepSeek V3 模型已完成

2025-04-15

DeepSeek 在其 GitHub 仓库发布预告称,即将开源推理引擎 DeepSeek Inference Engine。 考虑到代码分支和维护资源等问题,他们选择了直接和 vLLM 等现有开源项目合作的方式进行开源。 下面是官方公告: 几周前,在开源周期间,

2025-04-26

钟演讲,正式发布文心大模型4.5Turbo与X1Turbo版本,并披露DeepSeek模型在百度生态中的落地进展与现存挑战。 李彦宏透露,百度旗下文小言、百度搜索、百度地图等核心产品已接入DeepSeek满血版模型,在智能客服、搜索增强等场景

2025-05-01

DeepSeek 在官方 Hugging face 库上低调开源发布了其最新开源模型 DeepSeek-Prover-V2-671B。一个专注于数学定理证明的大语言模型,专门针对形式化数学证明任务进行优化。 新模型具有以下特点: 模型规模巨大:参数量约为671B(671

2025-05-09

透露了部分自己对于 AI 领域的想法。 主持人谈及「从 DeepSeek 身上学到什么」时,李想回答:「第一步一定要先搞研究」。李想进一步分析,研究跑通了以后研发效率会变得非常的高。 对于 DeepSeek 创始人梁文锋,李想则认为

2025-03-20

全国大学生同上一堂人工智能大课”主讲专家。 著有《DeepSeek全攻略》、《走进具身智能》等广受欢迎的科普书。 OSCHINA 有幸邀请到了陈光教授(@爱可可-爱生活)做客「高手问答」栏目,和大家一起聊聊 AI。 本月初,陈光

2025-03-26

上新!DeepSeek-V3重磅升级 昨夜,DeepSeek-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时,模型的开

2025-05-16

DeepSeek 团队近日发表了新论文《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》,把 DeepSeek-V3 在训练和推理过程中,如何解决“硬件瓶颈”的方法公布了出来。 论文主要介绍了 DeepSeek-V3 在硬件架构

2025-05-30

DeepSeek 发布官方消息,称 DeepSeek R1 模型已完成小版本试升级,用户可通过官方网页、APP以及小程序参与测试。 https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main 据悉,升级后的 DeepSeek R1 在语义理解精准性、复杂逻辑推理、长

2025-03-27

北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。 目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 https://huggingface.co/dee

2025-04-01

人工智能分析平台 aitools.xyz 最新数据显示,DeepSeek 已成为全球增长最快的 AI 工具,每月新增网站访问量超过 OpenAI 的 ChatGPT。该数据基于对 171 个类别的 10,500 多种 AI 工具的追踪。 报告补充称,DeepSeek 在 2025 年 2 月新增访问量

2023-12-01

布,其探索 AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继 11 月初发布 Coder 代码模型之后,正式发布通用大语言模型:DeepSeek LLM 67B。模型已完全开源,同时服务已经全面开放内测。 目前 DeepSeek 已同时开源 7B 和 67B 的