技术平权:大模型如何颠覆技术普及的传统模式?


OpenAI 联合创始人、前特斯拉 AI 负责人 Andrej Karpathy 近日在推特上发表文章《Power to the people: How LLMs flip the script on technology diffusion》


原文翻译如下:

变革性的技术,通常是沿着一条“自上而下”的路径普及开来的:它们先在政府或军方萌芽,随后进入企业界,最终才来到普通人身边——想想电力、密码学、计算机、航空、互联网和 GPS 这些例子就明白了。这个过程似乎是理所当然的,毕竟那些强大的新技术在早期往往是稀缺品,需要大量投入,还得有专业人士才能玩转。

所以,当我看到 LLM 彻底颠覆了这个规律时,真的觉得既独特又震撼——它们给普通大众带来了远超比例的益处,而在企业和政府层面,其影响力反而显得平淡和滞后。就拿 ChatGPT 来说,它是有史以来用户增长最快的消费级应用,每周有 4 亿活跃用户用它写作、编程、翻译、辅导、做总结、搞深度研究、进行头脑风暴等等。这可不是对现有工具的小修小补,而是对个人能力的全面、大幅提升。更关键的是,使用门槛低到令人难以置信:模型便宜(甚至免费)、反应快,任何人只要有网(甚至在本地电脑上)就能随时调用,而且它们还懂得各种语言,连语气、俚语和表情包都不在话下。这简直不可思议。在我看来,普通人从未如此迅猛、如此深刻地体验过一次技术带来的能力“解锁”。

那么,为什么在企业和政府这些机构里,LLM带来的好处就没那么明显了呢?我想,首要原因在于LLM的能力特点很特别:它能在极其广泛的领域里都懂一点,达到“准专家”的水平,但同时又不够深入,而且会犯错。

也就是说,它“博而不精”,还不可全信。而机构组织的独特优势恰恰在于,可以通过雇佣工程师、研究员、分析师、律师、营销专家等等,汇聚不同领域的深度专业知识。LLM 当然能帮助这些专家提高个人效率(比如起草个合同初稿、生成点基础代码),但对整个组织而言,更多的是在原有基础上“锦上添花”,让本来就能做的事做得更好一些。相比之下,个人通常最多只精通一件事,LLM 这种广泛的“准专业”能力,则从根本上让他们获得了以前不具备的能力。

现在,普通人也能凭感觉写出个App;能看懂甚至着手处理法律文件;能啃下高深的研究论文;能做数据分析;能制作像样的图文视频来做品牌营销。所有这些,他们自己就能达到不错的水平,不再需要额外请专家了。

其次,机构组织要处理的问题,其复杂度和协调要求都高得多。想想吧:系统集成、兼容老旧系统、遵循公司品牌和风格规范、严格的安全要求、隐私保护、国际化、满足监管合规、控制法律风险……变量、限制和要考虑的因素实在太多,而且出错的代价非常高。想把这么多条条框框都塞进LLM的对话框里可不容易。你不能随心所欲地让它“凭感觉”干活,一次离谱的“胡说八道”就可能让你丢掉饭碗。

再者,大机构普遍存在着根深蒂固的惯性:企业文化、历史包袱、快速变革期更显激烈的内部政治、沟通成本、庞大团队的再培训难题,以及那套老掉牙的官僚流程。面对一个新潮、全能但又不够成熟可靠的新工具,这些都是巨大的阻力。我不是要贬低LLM对企业和政府的潜在影响,但至少就目前而言,放眼整个社会,LLM对个人生活的改变,确实比对机构组织的改变要深刻得多。受益最多的,是张三李四王五这些普通人,而不是谷歌或美国政府这样的庞然大物。

展望未来,LLM能否继续普及,当然要看它的性能会不会持续提升,以及能力边界会不会扩展。其中,“利益如何分配”这个格局尤其值得关注,它很大程度上取决于“花多少钱能提升多少性能”这个“性价比”的动态范围。

目前,顶尖 LLM 的性能非常亲民,甚至可以说是廉价。达到这个水平后,再多花一点钱,也无法显著提升其性能、可靠性或自主性。钱买不来更好的 ChatGPT,比尔·盖茨跟你我一样用着 GPT-4o。

但这种情况能一直持续下去吗?通过扩大模型参数和数据进行训练时扩展、增加推理时间进行测试时扩展、以及使用模型集成等方法,都在试图拉大这个“性价比”的范围。另一方面,“模型蒸馏”(用大模型教小模型,让小模型变得异常强大)这类技术则在努力缩小这个范围。

可以肯定的是,一旦金钱真的能买到明显更强的 ChatGPT 时,游戏规则就会改变。大公司可以凭借雄厚资源购买更强的智能。而在“个人”这个群体内部,精英阶层也可能再次与普罗大众拉开差距。他们的孩子可以用 GPT-8 至尊版接受辅导,而你的孩子可能还在用 GPT-6 迷你版。

但无论如何,至少在此时此刻,我们正身处技术史上一个独特且前所未有的境况。回看各种科幻作品,你会发现几乎没人预料到人工智能革命会是这样一番景象。它本该是将军们掌握的、政府最高机密的超级大脑项目,结果却是 ChatGPT 这样几乎一夜之间冒出来、免费出现在每个人口袋里的设备上的东西。

还记得威廉·吉布森那句名言吗?“未来已来,只是分布不均”?但出乎意料的是——未来确实来了,而且它分布得惊人地广泛!这真是把力量交给了人民。

就我个人而言,我太喜欢这种状态了。

转载自:https://mp.weixin.qq.com/s/awPOFvHgpzFLw4hot4Z2Hw


相關推薦

2024-02-23

来产业创新发展的实施意见》,提出到2025年,未来产业技术创新、产业培育、安全治理等全面发展,部分领域达到国际先进水平,产业规模稳步提升;到2027年,未来产业综合实力显著提升,部分领域实现全球引领。 专家认为

2025-04-04

具”。这是克莱顿·克里斯坦森(Clay Christensen)“颠覆性技术”理论的核心观点之一。该理论始于一个观察:技术的进步速度往往快于用户需求的增长速度。从这个简单的洞见出发,引申出了一系列关于市场和产品如何随时间演

2024-10-15

过了4500家;一批人工智能领域专精特新企业茁壮成长,技术创新能力不断提升,专利申请量和授权量居全球前列。 德勤此前撰文称,数字化和智能化作为推动产业链、供应链优化升级的关键驱动力,在生成式人工智能(生成式

2024-10-19

、国务院高度重视开源体系建设的背景下,上海开源信息技术协会在上海市经济和信息化委员会指导下认真落实国家政策的重要活动。来自中科院、清华大学、北京大学、华东师范大学、上海交通大学、复旦大学、北京科技大学

2025-03-26

的浙江省鲲鹏生态创新中心为浙江数字经济的发展提供了技术支撑和创新动力。 作为国产算力的中坚力量,在硬件层面,鲲鹏CPU展现出强大竞争力,部件、整机实现全量自主创新,构建起坚实的自主创新产业链;在基础软件领

2025-04-10

当开源理念走出封闭的实验室,走进全球开发者的视野,技术协作不再仅仅是生产力,更是人类共同精神的体现。对无数技术人而言,开源PHP不仅是促进技术交流与开源协作的平台,更是寄托理想的精神家园,在这里,他们找到

2025-03-25

百度创始人李彦宏在介绍秒哒时曾指出,无代码编程技术依托大模型直接生成代码,彻底颠覆了传统编程模式,实现了零代码门槛,任何人都能快速上手。 此外,多智能体协作功能则基于百度文心大模型的先进思考与规划能

2024-03-02

千行百业,才能发挥出更大价值。要正视中美在人工智能技术上的差距,但也不必妄自菲薄。中国在制造业、服务业、交通业、健康教育等领域拥有丰富应用场景,加之拥有超大规模市场优势,能为人工智能产业提供更多发展空

2024-07-16

openKylin 2.0版本即将与大家见面,该版本不仅深度融合AI技术,提升系统智能化能力,还完成了多项操作系统底层核心技术颠覆性变革,引入不可变系统、开明软件包格式和Wlcom窗口管理器等创新特性,使openKylin操作系统在稳定性

2024-08-29

的形成。 MaxKB开源知识库问答系统的引入 随着人工智能技术的快速发展和应用普及,智能问答系统已经成为各类机构提升公共服务质量和效率的重要工具。在这一背景下,针对深圳信用网当前的需求,深圳市公共信用中心响应

2023-10-24

时代 彭博社近日的报道透露了苹果公司内部对生成式 AI 技术的反应。 这篇报道引用了苹果首席执行官 Tim Cook 的原话:“苹果多年来一直致力于生成式 AI 技术。但我可以明确地告诉你,苹果高管对行业突如其来的人工智能热

2023-11-12

久的将来,任何上网的人都可以拥有一个由远远超出当今技术的 AI 驱动的个人助理。 比尔·盖茨说道,这种对自然语言做出反应,并能根据对用户的了解完成许多不同任务的软件被称为 Agent。而他在这 30 多年来,一直在思

2025-04-04

动化任务,可能对搜索引擎、讨论论坛、社交媒体和教育技术产生颠覆性影响 主要表现者包括: 1、OpenAI同比增长38% 2、Deepseek显示出异常增长,同比增长1,688% 3、谷歌的AI产品增长50% 4、Perplexity增长52% 5、Claude(Anthropic)强

2023-03-02

数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 智源研究院2020年搭建大模型攻关团队,2021年6月推出当时规模最大、性能领先多模态大模