- Published on
2025 企业级AI应用展望
- Authors
- Name
- LI Tian
基础语言大模型继续强大但需要软件工程
Foundation Models as a Service(基础模型即服务): 尽管像ChatGPT这样的聊天机器人取得了显著进步,但在解决现实世界问题方面仍显不足。现实世界的需求复杂多样,需要更详细和深入的解决方案。比如LangGraph的Agent框架,Anthropic推出的MCP协议,但是这些解决复杂任务的能力目前还是开发门槛较高。
基础模型的竞争: 这是一场数据科学领域的竞赛。尽管媒体报道的重点各有不同,但作为应用工程师来说,更关注如何高效利用一些框架和模式来完成任务。2023年从GPT4开始,在推理和多模态上就是LLM一个突出的短板。
LLM一定会继续增强能力,AI先锋公司也一定会AI能力上下足功夫竞争。但是作为软件工程师的我们,还是应该专注于软件工程开发上,思考如何快速有效的构建应LLM应用程序,解决现实中的复杂任务。
企业面临的挑战
- 高Token消耗: 随着AI应用的深入,Token消耗激增,虽然工程师在Agent和RAG上节省token使用量,但是成本的上升是必然,如何平衡Token消耗量也是一个非常重要的性能监测指标。然而,我相信,随着市场竞争的加剧,这些成本将逐渐降低。比如DeepSeek的横空出世,证明了大语言模型也不是一定要走堆Nvida显卡的路线。
- 私有化部署(数据监管): 为了保护数据安全,许多公司倾向于私有化部署大模型。然而,这通常伴随着昂贵的硬件成本。DeepSeek提出的“蒸馏”技术为这一困境提供了新的解决方案,使小模型具备大模型的能力,从而显著降低硬件需求。这提供了一个非常好的思路,就是传统企业也有机会不完全依赖LLM的服务提供者,而专注自身的,可负担的企业算力中心。
- 行业知识壁垒与缺乏成熟的开发模型: 基础大模型由于缺乏行业特定的知识库和流程支持,难以满足企业流程和精准度的要求。此外,当前的软件开发工具和框架尚不成熟,尚未为开发者提供一套便捷的模板或模式可供使用。回顾软件开发的历史,每当新技术催生出有效的开发模型(如设计模式),都会显著推动相关领域的发展。对于AI应用而言,开发成熟的AI应用开发模型将是关键的一步。只有这样,企业才能更轻松地构建高效、定制化的AI解决方案,并鼓励非IT企业尝试和创新企业级AI应用。
2025年的探索
在2025, 我应当注重如下,
- 深化蒸馏技术研究: 学习并应用DeepSeek的开源蒸馏方法,开发适合企业需求的小型高效模型.
- 优化私有化部署策略: 探索企业数据中心与云服务等不同部署方案,以找到最具性价比的解决方案。
- 广泛推动AI Agent在企业中的应用: 整合现有框架,开发更适合企业应用场景的Agent解决方案,降低使用门槛,提高采用率。
我的观点,”不是每个任务都需要性能强大的计算机,往往这些任务只需要一个稳定运行的计算器“,同样,”不是每个任务都需要性能强大的LLM,往往这些任务只需要输出精准且稳定的的AI应用程序“