AI的记忆:从“火锅桌”说起
作者:微信文章跟AI聊天,你是不是也怕它“过会儿就忘”?这得从“火锅桌”说起
你有没有过这样的经历?你正在跟一个AI助手聊得火热,从天文地理聊到人生哲学,你感觉它简直是你的灵魂伴侣,懂你,甚至比你自己还懂。你兴致勃勃地铺垫了半天,准备提出那个终极问题,结果它一开口:“您好,有什么可以帮您的吗?”
瞬间,你所有的热情都被浇了一盆冷水。那感觉,就像你跟朋友滔滔不绝讲了半小时过去,他突然抬起头来一脸茫然地问:“啊?你刚才说啥?”
这种“我本将心向明月,奈何明月是金鱼”的挫败感,其实源于一个非常核心又有趣的概念——大语言模型(LLM)的上下文(Context)。
别被这名字吓到,今天,不说什么“tokens”、“Transformer架构”,咱换个场景,一个你绝对熟悉的场景——吃火锅。
你的聊天AI,其实是个只有一张饭桌的火锅店老板
想象一下,你常去的那个AI,无论是文心一言、通义千问,还是其他的什么模型,它都不是一个无所不知、记忆无限的神仙。它更像一个记忆力超群但规矩奇葩的火锅店老板。
这个老板的火锅店里,只有一张桌子。
这张桌子,就是AI的“上下文窗口 (Context Window)”。 你跟AI的每一次对话,都是在这张桌子上“涮火锅”。
你说的每一句话,比如“老板,给我来份儿内蒙羔羊肉”,就是一盘菜。AI的每一个回答,比如“好嘞,您的羔羊肉,请慢用”,也是一盘菜。
你们的对话,就是你一盘我一盘地往桌上摆菜。只要桌子还没摆满,老板(AI)就能清清楚楚地看到桌上所有的菜。它知道你刚点了什么,知道你不要麻酱要蒜泥,知道你提醒过不要香菜。所以它能跟你对答如流,甚至“记住”你说过的话。
“桌子”摆满了,尴尬就来了
问题是,这张桌子的大小是有限的。 不同AI的“桌子”大小不一样,有的能摆4000盘菜(比如早期的GPT-3.5),有的能摆十几万盘(比如最新的模型),甚至有的超级大胃王能摆上百万盘。 但不管多大,它终究有个头儿。
当你跟AI的对话越来越长,桌上的“菜”就越来越多。当你摆上第4001盘菜的时候,桌子满了,怎么办?
这位奇葩老板的做法不是换个大桌子,而是——为了给你新上的这盘“毛肚”腾地方,他会默默地把你最早点的那盘“羔羊肉”给收走。
你可能毫无察-觉,但你最初的指令、最早的铺垫,就这么消失了。
这就是为什么,当你跟AI聊了九九八十一轮之后,再问它:“还记得我们最开始聊的那个话题吗?” 它很可能会一脸无辜地回答:“抱歉,我们最开始聊了什么?”
因为它那张桌子上,最早的那些“菜”已经被后面新上的菜挤下去了。它不是不尊重你,是它的工作机制(或者说,记忆容量)就是如此。它只能“看到”桌上现有的菜,桌子以外的,对它来说就等于不存在。 这种现象,行话叫“截断(Truncation)”。
大桌子 vs 小桌子:不仅仅是能摆多少菜
你可能会想,那简单,以后我就找“桌子”最大的那个AI聊天不就行了?
理论上是这样。一张能摆十几万盘菜的大桌子,确实能让AI在更长的对话中保持连贯,能让它一次性读完一本几十万字的小说并进行总结。 这也是为什么现在的AI模型都在拼命“扩建”自己的火锅桌,也就是扩展上下文窗口。
但事情没那么简单。
管理成本更高:桌子越大,老板每次上菜、和你确认菜单时,需要扫视的范围就越广。这会消耗更多的“精力”(也就是计算资源)。所以,和拥有超大上下文窗口的AI进行长对话,通常费用也更高。可能会“看花眼”:研究发现,有些AI即使桌子很大,也容易“注意力不集中”。它们往往对桌子两头,也就是最新摆上来的菜(你最新的问题)和最开始摆上来的菜(最早的指令)印象最深,而对摆在中间的一大堆菜,可能会“视而不见”,导致忽略掉对话中段的重要信息。
所以,就算给了AI一张无限大的桌子,它也未必能成为完美的聊天对象。
如何成为一名“优秀的火锅顾客”?
看到这里,你是不是有点豁然开朗?和AI打交道,其实就是学习如何跟这位“火锅店老板”高效沟通。
开新局,换新桌:如果你要聊一个全新的话题,别在原来的“残局”上继续。另开一个对话窗口,相当于跟老板说:“老板,刚才那桌结了,我们换个新桌重新吃!” 这样能保证他100%专注于你的新话题。前情提要,温故知新:在进行长对话时,可以适时地帮AI“划重点”。比如,你可以说:“别忘了,我们之前设定的目标是A,现在我们来讨论如何实现B。” 这就好比你把桌子中间快被遗忘的那盘“金针菇”又端到了老板面前,让他重新注意到。精简你的“菜品”:别说车轱辘话。你的指令越是清晰、简洁、直奔主题,就越不容易被挤出那张有限的桌子。
说到底,所谓的“AI上下文”,就是它那块容量有限、只能记住当前对话内容的“临时工作台”。 它没有我们人类那种可以随时调用的、海马体里储存的长期记忆。它所有的智慧和反应,都基于它“眼前”这张火锅桌上的菜品。
理解了这一点,你或许就能释然了。下一次,当AI又一次“忘记”了你们的约定,别生气,也别失望。试着跟它说:“老板,麻烦看一下,咱们最开始点的那盘‘初心’,还在桌上吗?”
这,就是我们与这个时代最聪明的“最强大脑”之间,一种充满乐趣又极具技巧的相处之道。
页:
[1]