添加 登录

评论

只有登录用户才可以评论

Andrej Karpathy在2025年6月18日Y Combinator AI Startup School的演讲《Software Is Changing (Again)》中,系统阐述了软件开发的第三次范式革命,核心观点可概括为以下五个方面:


🧠 一、软件演进的三个阶段:从代码到自然语言

  1. Software 1.0
    传统手写代码(如Python/C++),开发者需精确编写逻辑指令,代表平台为GitHub。
  2. Software 2.0
    以神经网络权重为核心,开发者通过数据训练生成模型参数(如AlexNet),代表平台为Hugging Face——其地位相当于“模型界的GitHub”。
  3. Software 3.0
    自然语言成为新编程接口:用户通过英语等自然语言编写提示词(Prompt)直接指挥大语言模型(LLM),提示词即程序。例如情感分析任务中,一句“判断此评论情感倾向”即可替代传统代码或模型训练。

⚙️ 二、LLM的三重属性与“新操作系统”生态

Karpathy将大语言模型(LLM)定义为兼具三种行业特性的革命性存在:

  • 公共设施(Utility):如OpenAI、Anthropic等实验室投入巨资训练模型,通过API按Token计费分发智能,类似电网的按需供应。
  • 晶圆厂(Fab):训练LLM需百亿级资本投入,技术壁垒高,少数巨头垄断核心研发(如谷歌TPU vs. 英伟达GPU模式)。
  • 操作系统(OS)
    LLM构成新型计算平台:上下文窗口如内存,提示词调度如CPU指令,闭源模型(GPT/Claude)与开源社区(LLaMA)并存,生态类似Windows/Linux之争。
    💡 当前阶段类比“1960年代计算模式”:云端集中式计算,用户通过“瘦客户端”远程访问,尚未进入个人智能设备普及时代。

⚠️ 三、LLM的认知缺陷与协作挑战

Karpathy指出LLM本质是“人类心智的幽灵”(People Spirits),基于人类数据训练涌现类人心理,但存在显著短板:

  1. 锯齿状智能(Jagged Intelligence)
    能解决复杂问题却常犯基础错误(如认为9.11 > 9.9)。
  2. 顺行性遗忘(Anterograde Amnesia)
    无法持久记忆,超出上下文窗口的信息立即丢失。
  3. 安全与可靠性问题
    易受提示注入攻击,产生幻觉(Hallucination),需严格验证输出。
    解决方案:通过系统提示学习(System Prompt)定义能力边界,构建“生成-验证”高效循环。

🤖 四、人机协作新模式:半自主化与“钢铁侠战衣”哲学

  1. 自主性滑块(Autonomy Slider)
    动态调节AI参与度,例如编程工具Cursor支持从代码补全(低自主)到重构整个项目(高自主),人类始终保持最终决策权。
  2. 氛围编程(Vibe Coding)
    自然语言描述意图而非精确逻辑,例如Karpathy用提示词一天开发iOS应用Menu Gen,无需Swift基础。
  3. 关键主张

    “不要造钢铁侠,要造钢铁侠的战衣” —— 增强人类能力,而非追求完全自主的AGI。


🔮 五、未来方向:重构AI原生基础设施与开发者机遇

  1. 为AI智能体重建数字世界
    当前网站/文档依赖人类交互(如“点击这里”),需设计机器可读协议(如LLM.txt)和API优先接口(如Stripe的Curl命令文档)。
  2. 开发者新定位
    • 需同时掌握三种范式:传统编码(1.0)、模型训练(2.0)、提示工程(3.0)。
    • 角色从“写代码”转向“意图描述与结果审核”。
  3. 行业十年展望
    • 短期:半自主应用爆发(如Perplexity研究助手)。
    • 长期:智能体(Agent)渗透企业工作流,但人类仍是闭环决策者。

💎 总结:根本性变革与行动呼吁

Karpathy强调,Software 3.0不是工具迭代而是“计算语言转移”——从机器码到自然语言的跃迁,其颠覆性堪比从命令行到图形界面的跨越。他呼吁开发者拥抱这场变革:

“我们站在软件重写的浪潮上,未来十年需重构海量系统,这是进入行业最激动人心的时刻。”

延伸参考

  • 演讲视频:Youtube链接
  • 技术细节:LLM心理学框架、分时计算模型、Vibe Coding实践案例详见。
瓦白 2025-06-22 22:42:02