🚩 AI应用开发告别“感觉良好”:构建高价值AI Agent测试集的指南

你刚刚迭代了你的AI Agent,它似乎比旧版更聪明、更流畅了。但这种“感觉”是不可靠的。当你的老板、同事或客户问“新版到底好在哪?具体提升了多少?”时,你该如何用冰冷的数据来证明?答案就是构建一个高质量、系统化的测试集。这是将开发中的主观感受,转化为工程上客观度量的唯一可靠途径。

🎆 陆奇 | 《新范式 新时代 新机会》5月7日 笔记

陆奇博士系统化的讲了数字化转型、新范式的思考框架。他的三位一体的方法论,从6个方面分解数字化需求的框架都值得学习。

🤖 Tree of Thoughts TOT利用大模型来辅助决策推理

通过思想树(Tree of Thoughts TOT)进行多种不同的推理路径和自我评估来进行深度的决策评估。