【解决复杂链式任务打造全能助手】大模型思维链 CoT 应用：langchain 大模型结合做 AutoGPT

2024-01-01 06:20:10

大模型思维链 CoT 应用：langchain 大模型结合做 AutoGPT，解决复杂链式任务打造全能助手

思维链 CoT
langchain
langchain 大模型结合
打造 AutoGPT

思维链 CoT

最初的语言模型都是基于经验的，只能根据词汇之间的相关性输出答案，根本没有思考能力……

但是从使用思维链后，大模型已经是有思考能力的。能进行一定的推理。

2021年，OpenAI在训练神经网络过程中有一个意外发现。

神经网络他可以很好地模仿现有的数据，很少犯错误。

可是如果你给他出个没练过的题目，他还是说不好。于是你就让他继续练。

继续训练好像没什么意义，因为现在只要是模仿他就都能说得很好，只要是真的即兴发挥他就不会。

但你不为所动，还是让他练。

$10^2$ 到 $10^5$ 训练完全没有成果。

就这样练啊练，惊奇地发现，他会即兴演讲了！给他一个什么题目，他都能现编现讲，发挥得很好！

一千步乃至一万步，模型对训练题的表现已经非常好了，但是对生成性题目几乎没有能力
练到10万步，模型做训练题的成绩已经很完美，对生成性题也开始有表现了
练到100万步，模型对生成性题目居然达到了接近100%的精确度

这就是量变产生质变。研究者把这个现象称为「开悟（Grokking）」。

2022年8月，谷歌大脑研究者发布一篇论文，专门讲了大型语言模型的一些涌现能力，包括少样本学习、突然学会做加减法、突然之间能做大规模、多任务的语言理解、学会分类等等……

而这些能力只有当模型参数超过1000亿才会出现 —— 涌现新能力的关键机制，叫 思维链。

简单说，思维链就是当模型听到一个东西之后，它会嘟嘟囔囔自说自话地，把它知道的有关这个东西的各种事情一个个说出来。

思维链是如何让语言模型有了思考能力的呢？

比如你让模型描写一下“夏天”，它会说：“夏天是个阳光明媚的季节，人们可以去海滩游泳，可以在户外野餐……”等等。

只要思考过程可以用语言描写，语言模型就有这个思考能力。

怎么用思维链呢？

思维链的主要思想是通过向大语言模型展示一些少量的样例，在样例中解释推理过程。

那大语言模型在回答提示时也会显示推理过程，这种推理的解释往往会引导出更准确的结果。

既然如此，只要我们设置好让模型每次都先思考一番再回答问题，ta就能自动使用思维链，ta就有了思考能力。

langchain

langchain 大模型结合

打造 AutoGPT

文章来源:https://blog.csdn.net/qq_41739364/article/details/135320630
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！

【解决复杂链式任务打造全能助手】大模型思维链 CoT 应用：langchain 大模型 结合 做 AutoGPT

大模型思维链 CoT 应用：langchain 大模型 结合 做 AutoGPT，解决复杂链式任务打造全能助手

思维链 CoT

langchain

langchain 大模型结合

打造 AutoGPT

【解决复杂链式任务打造全能助手】大模型思维链 CoT 应用：langchain 大模型结合做 AutoGPT

大模型思维链 CoT 应用：langchain 大模型结合做 AutoGPT，解决复杂链式任务打造全能助手