AI独角兽团队交流笔记
作者:微信文章今天很高兴接待了一只才华横溢的独角兽AI团队来访,并有机会一起交流海外专业服务AI Agent实践中的若干问题,获益良多。同时也深刻感受到,Agent市场崛起的大潮正处在现在进行时,大量的概念其实早已经进入深水作业,并在静水潜流中不断箭速迭代ing。
关于客户Agent开发实践的交流讨论笔记:
在专业服务Agent的Use Case里,AI能力边界到底到哪里了,中间需要工程优化的部分,有来自为了满足合规的需求,还有来自为了对子领域知识做更好的拆解,让AI更好地对专业领域做深度的解读,重点的抽取,用最少的信息能够更好回答用户问题的需求。
业内目前在专业Use Case常用的MVP验证路径,往往先不做行业小模型,先用通用模型,公网API来尝试,当Use Case获得用户正反馈以后,再投入去做定制的Agent的开发,以实现更好的用户体验和成本效率。
基于确定性的数学、物理和编程等逻辑,基础模型能力越来越强,但是长记忆能力不成熟,而且似乎短期内得不到解决,或者说解决模型记忆的资源成本代价太过于巨大,不具备可Scale Up的方案。
在具体专业Use Case的开发实践上,大家普遍偏向Multi Agent架构的方向,而不认为Single Agent架构是未来。后者无法摆脱过度依赖底座模型以及受到其黑盒方案的局限,而前者可以在用户交互及其工程优化上有较大空间把任务收集、汇总、路由和分发做出差异化,做出用户交互体验的价值,以减少或者对冲其对底座模型能力的依赖。
但是在Multi Agent架构下的开发实践,绕不开用户上下文语义理解的难点,在用户交互过程中什么时点引入第三方Agent,什么时点开启新对话框,都是产品设计中普遍容易纠结的点,需要面对不同的选择不断试错、迭代、调优。
最新一代的Agent设计实践到底能不能摆脱对前代产品普遍在用户意图理解体系上的依赖(例如某游戏NPC Agent产品设计里的用户意图理解树),这个模块大家普遍认为虽然存在多种可选工程方向和路径,但基本还是一个无法去掉的对用户体验和成本效率影响都比较大的模块。例如一个专业服务Agent如何把一百万种用户问题映射到三种具体的专业任务,不管是通过人工分类,还是通过训练一个专门的小模型前置来判断和路由,亦或者加大马力通过消耗更多的资源来实现,目前看来对用户意图理解的前置分析和路由分发都还是一直有必要存在的。
关于面向Agent的库表设计,有比较大的工程优化空间,用户想到哪问到哪,大多数用户问题其实是比较通用和基础的,如果对每个问题都要让AI去扫所有的库表,资源成本消耗必然巨大,且响应时间用户体验不够好,这种时候加一些RAG前置能力是一种工程改造的方向,同时也可以回到用户意图理解里去尝试一系列可选的工程实现路径和方案。
关于Agent和工具概念上的区别。
Agent需要思考,对用户问题给出多样化的答案和结果;而工具应该克制,追求输入输出的标准化,工具的设计上应该原子化,给提供AI调用做准备,例如SQL语句生成器等。
... ...
海外Agent市场的潮头浪尖离不开新一代年轻优秀的中国工程师群体,中国工程师红利溢出全世界依然将是下一个10—20年持续的大浪潮。
Stay Foolish,Stay Hungry,多和全球化的开发者在一起,多服务全球化开发者,未来依然是一件很有意义的事情。
页:
[1]