红杉资本发布一份报告,总结了这一年生成式AI突飞猛进的发展,探讨了生成式AI的发展趋势和市场表现。
一年前他们发布了一份预测,一年后红杉总结之前的预测,发现了他们预测正确和错误的部分:
预测错误的部分:
1.事情发展得很快。他们原以为需要近十年的时间才能实现实习生级别的代码生成、好莱坞质量的视频或不听起来像机器的人类语音。但现实是,技术发展的速度超出了他们的预期。
2.供应端的瓶颈。他们没有预见到用户需求会超过GPU供应的情况。许多公司的增长瓶颈不是客户需求,而是获取Nvidia的最新GPU。
3.垂直分离尚未发生。他们认为“应用层”公司和基础模型提供商之间会有一个分离,但实际上这种分离尚未清晰地发生。
4.竞争环境的激烈和现有公司的迅速响应。市场上的某些领域(如图像生成和文案写作)竞争激烈,而现有公司的快速响应加剧了竞争压力。
5.壁垒在客户而不是数据中。他们预测最好的生成式AI公司可以通过数据飞轮获得持续的竞争优势,但实际上数据的壁垒并不稳固。
预测正确的部分:
1.生成式AI是一个事实。突然之间,每个开发者都在开发生成式AI应用,每个企业买家都在要求它。
2.第一个杀手级应用已经出现。例如,ChatGPT成为了最快达到1亿MAU的应用。
3.开发者是关键。开发者首先的公司如Stripe或Unity的核心见解是,开发者的接入可以打开你甚至无法想象的用例。
4.形式因子正在演变。AI应用的第一版本主要是自动完成和初稿,但这些形式因子现在正在变得更加复杂。
5.版权、伦理和存在的恐惧。在这些热门话题上,辩论持续不断。
新兴的产品蓝图 (Emerging Product Blueprints):
随着新兴技术的应用,未来的AI产品将更加符合用户的需求和期望。这些趋势显示了AI产品将变得更加智能、自主和用户友好,为用户提供更加丰富和高效的体验。
1、生成式接口:基于LLM的文本型对话用户体验是默认的接口。逐渐地,新的形式因素正在进入武器库,从Perplexity的生成式用户界面到Inflection AI的新的人声模式。
随着技术的进步,不仅仅是文本,还有其他形式的生成式用户界面和人声模式正在出现。这意味着未来的AI产品将提供更多样化的交互方式,使用户体验更加丰富和自然。
2、新的编辑体验:从Copilot到Director’s Mode。传统的编辑工作流程正在发生变化。生成式AI不仅仅是为用户提供自动完成或初稿,现在它们提供了更多的控制和定制选项。
例如:Midjourney的新的平移命令和Runway的Director’s Mode创造了新的相机般的编辑体验。Eleven Labs使通过提示操作声音成为可能。
3、日益复杂的代理系统:生成式AI应用程序的能力正在扩展。它们不再仅仅是为人类提供答案或建议,现在它们有能力自主解决问题,访问外部工具,并代表用户完成任务。这意味着AI产品将更加智能和自主,能够为用户提供更多的帮助。
4、系统范围的优化:AI的能力不仅仅是提高个体的效率,还可以优化整个系统。例如,AI可以自动处理支持票据或拉取请求的部分内容,使整个系统更加高效。
AI产品开发中的努力和创新,以及行业中共享的策略和技术的发展。
生成式AI领域的最新技术和工具的进展。这些进展使得AI模型更加强大、灵活和实用,同时也为开发者提供了更多的资源和工具来创建高质量的AI应用。这也意味着,随着这些技术和工具的应用,未来的AI产品将更加智能、准确和有用。
模型开发栈 (The Model Development Stack):
1、新兴的推理技术:如chain-of-thought、tree-of-thought和reflexion正在提高模型执行更丰富、更复杂的推理任务的能力,从而缩小了客户期望与模型能力之间的差距。开发者正在使用像Langchain这样的框架来调用和调试更复杂的多链序列。
2、迁移学习技术:如RLHF和fine-tuning变得更加易于访问,特别是考虑到GPT-3.5和Llama-2的fine-tuning的最近可用性,这意味着公司可以将基础模型适应到他们特定的领域,并从用户反馈中改进。开发者正在从Hugging Face下载开源模型,并进行微调以实现高质量的性能。
3、检索增强生成:为业务或用户引入上下文,减少幻觉并增加真实性和实用性。像Pinecone这样的公司提供的向量数据库已经成为RAG的基础设施支柱。
4、新的开发者工具和应用框架:为公司提供可重用的构建块来创建更高级的AI应用,并帮助开发者评估、改进和监控生产中的AI模型的性能,包括像Langsmith和Weights & Biases这样的LLMOps工具。
5、AI-first基础设施公司:如Coreweave、Lambda Labs、Foundry、Replicate和Modal正在解构公共云,并提供AI公司最需要的东西:大量的GPU,价格合理,随需应变且高度可扩展,具有良好的PaaS开发者体验。
这些技术应该可以缩小模型的期望与现实之间的差距,同时基础模型也在不断地改进。但仅仅使模型变得出色只是整个战斗的一半。生成式AI首次用户体验的剧本也在演变。
生成式 AI 市场图
生成式 AI 基础设施技术栈
完整报告:https://www.sequoiacap.com/article/generative-ai-act-two/