🚩 AI应用开发告别“感觉良好”:构建高价值AI Agent测试集的指南

你刚刚迭代了你的AI Agent,它似乎比旧版更聪明、更流畅了。但这种“感觉”是不可靠的。当你的老板、同事或客户问“新版到底好在哪?具体提升了多少?”时,你该如何用冰冷的数据来证明?答案就是构建一个高质量、系统化的测试集。这是将开发中的主观感受,转化为工程上客观度量的唯一可靠途径。

Lazy loaded image RAG已死?2025年大模型问答架构的范式思考

还记得为搭建企业知识库问答系统,在向量数据库和Embedding中挣扎的夜晚吗?当我们还在优化RAG的召回率时,一个更简单的范式已悄然崛起:搜索优先的Agent架构。最近读了一篇《》的文章,有些启发。在2025年,RAG真的还是首选吗?本文将用数据和案例带您重新审视这场技术革命。

🧱 RAG:构建企业知识防火墙与智能引擎的方法

RAG可以赋能大模型应用,使得企业在保持隐私、提高准确性情况下利用大模型能力。

🗒️ 如何理解RAG

RAG的重要性,一方面在于扩大了大模型的上下文;另一方面在于在大模型的知识外增加了知识库(而这个知识库还可以有企业的私有特性),第三个是减少了幻觉,增加可靠性。

🗒️ AI Agents vs. Agentic AI

Agent何Agentic AI概念被提及的都很多,如何区分两者?AI Agents更侧重于单个智能体在特定任务中的自主执行和工具使用,而Agentic AI则强调多个智能体之间的协作、协调和系统级智能,以应对更复杂、动态和长期的问题。

🗒️ 转:Rethinking digital transformation for the agentic AI era

Three areas CIOs should focus on include renewing customer centricity’s importance, evolving business engagement practices, and refining their organization’s digital operating model.

🏗️ AI Agent在实际应用领域的情况(reddit 202505)

AI Agent 的发展重点将是多智能体协作系统,而非单一的全能型智能体。这些系统侧重于优化后端运营,而非仅仅面向客户。

🗒️ 如何构建有效的Agent

Claude在24年12月份发表"Building effective agents" ,这篇文章的核心思想是:构建高效的 AI Agent 系统,应从简单的构建模块开始,逐步增加复杂性,并根据任务需求选择合适的工作流模式。同时,要重视工具设计和迭代优化,确保 Agent 的可靠性和有效性。 这篇文章为开发者提供了实际可操作的指导,强调了在实际应用中保持简单性和灵活性。

Lazy loaded image langchain:使用langchain和chatGPT来处理问答

这篇文档很好的帮助理解如何将知识库与大模型结合起来使用。

Lazy loaded image coze(字节跳动)在大模型应用上另辟蹊径

字节跳动从应用层面构建入口,让用户零代码构建bot,整合workflow与LLM,走了与文心一言、通义千帆不一样的路,并且是让人很有启发的路。

Lazy loaded image Sora于2024年2月16日发布

Sora的发布像去年chatGPT问世一样惊世,它生成的视频是如此的逼真,如此的流畅,并且还将物理世界的光影与受力考虑进去,实在令人惊奇。AI技术发展速度之快,超出了我的想象,并且微软、Google、NVIDIA、OpenAI、Meta、苹果等巨头你追我赶展现的产品令我五味杂陈。

🗒️ 【碎碎念】20240114 关于AI翻译

看《哈佛商业评论》中文版上的文章,有很多的译者已经是DEEPL、ChatGPT、飞书等AI工具了。改变是逐步的,也是显著的。