你刚刚迭代了你的AI Agent,它似乎比旧版更聪明、更流畅了。但这种“感觉”是不可靠的。当你的老板、同事或客户问“新版到底好在哪?具体提升了多少?”时,你该如何用冰冷的数据来证明?答案就是构建一个高质量、系统化的测试集。这是将开发中的主观感受,转化为工程上客观度量的唯一可靠途径。
还记得为搭建企业知识库问答系统,在向量数据库和Embedding中挣扎的夜晚吗?当我们还在优化RAG的召回率时,一个更简单的范式已悄然崛起:搜索优先的Agent架构。最近读了一篇《》的文章,有些启发。在2025年,RAG真的还是首选吗?本文将用数据和案例带您重新审视这场技术革命。
RAG可以赋能大模型应用,使得企业在保持隐私、提高准确性情况下利用大模型能力。
RAG的重要性,一方面在于扩大了大模型的上下文;另一方面在于在大模型的知识外增加了知识库(而这个知识库还可以有企业的私有特性),第三个是减少了幻觉,增加可靠性。
Agent何Agentic AI概念被提及的都很多,如何区分两者?AI Agents更侧重于单个智能体在特定任务中的自主执行和工具使用,而Agentic AI则强调多个智能体之间的协作、协调和系统级智能,以应对更复杂、动态和长期的问题。
Three areas CIOs should focus on include renewing customer centricity’s importance, evolving business engagement practices, and refining their organization’s digital operating model.
AI Agent 的发展重点将是多智能体协作系统,而非单一的全能型智能体。这些系统侧重于优化后端运营,而非仅仅面向客户。
Claude在24年12月份发表"Building effective agents" ,这篇文章的核心思想是:构建高效的 AI Agent 系统,应从简单的构建模块开始,逐步增加复杂性,并根据任务需求选择合适的工作流模式。同时,要重视工具设计和迭代优化,确保 Agent 的可靠性和有效性。 这篇文章为开发者提供了实际可操作的指导,强调了在实际应用中保持简单性和灵活性。
这篇文档很好的帮助理解如何将知识库与大模型结合起来使用。
字节跳动从应用层面构建入口,让用户零代码构建bot,整合workflow与LLM,走了与文心一言、通义千帆不一样的路,并且是让人很有启发的路。
Sora的发布像去年chatGPT问世一样惊世,它生成的视频是如此的逼真,如此的流畅,并且还将物理世界的光影与受力考虑进去,实在令人惊奇。AI技术发展速度之快,超出了我的想象,并且微软、Google、NVIDIA、OpenAI、Meta、苹果等巨头你追我赶展现的产品令我五味杂陈。
看《哈佛商业评论》中文版上的文章,有很多的译者已经是DEEPL、ChatGPT、飞书等AI工具了。改变是逐步的,也是显著的。