GPT-4等大模型迎来进化转折点:不只是使用,还会自己制作工具了
在人类的进化史中,制作和使用工具是关键的转折点。如今,在 Google Deepmind 等最新的研究中,大语言模型也具备了相似的能力,进化成了
在人类的进化史中,制作和使用工具是关键的转折点。如今,在 Google Deepmind 等最新的研究中,大语言模型也具备了相似的能力,进化成了工具制作者。
大语言模型的崛起
大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成类似于人类语言的文本。目前,开源的大语言模型主要有三大类:ChatGLM衍生的大模型(wenda、ChatSQL等)、LLaMA衍生的大模型(Alpaca、Vicuna、BELLE、Phoenix、Chimera等)、Bloom衍生的大模型(Bloomz、BELLE、Phoenix等)⁹。
其中,GPT-4是OpenAI最新发布的大语言模型,也是目前最先进的系统之一¹²。GPT-4采用了多模态的设计,可以接受图像和文本输入,并输出文本。GPT-4在各种专业和学术的基准测试中表现出了人类水平的性能,例如,在模拟律师资格考试中得分位于考生前10%;而GPT-3.5则位于考生后10%²。
大语言模型的创新
除了在广泛的NLP任务中表现出卓越的能力,大语言模型还展现出能够实现通用人工智能某些方面的良好迹象。例如,它们可以进行复杂的推理、创造和协作,并处理更长和更细致的上下文¹²。
此外,与人类的智能进化类似,大语言模型在最近的研究中被揭示出使用外部工具从而提升解决问题能力及效率的潜力。需要注意的是,这些工具使用方法的适用性很大程度程度上取决于是否有合适的工具。从人类进化的里程碑可以发现,人类进化的关键转折点是人类有能力制造工具来解决出现的困难⁶。
受到制造工具对人类重要性的启发,在本文中,Google Deepmind、普林斯顿和斯坦福大学的研究者将这种「进化」的概念应用于LLM领域,进行了初步探索⁶。他们提出了一个闭环框架,在这个框架中LLM作为工具制作者(LLMs As Tool Makers ,LATM),使其能够生成自己的可重新使用的工具来处理新任务⁶。
大语言模型的应用
LATM框架包括两个关键阶段:工具制作和工具使用。每个阶段都利用不同类型的大语言模型来平衡性能和成本效率。对于工具制作阶段,该阶段采用强大但成本更高昂的模型(例如GPT-4)作为工具制作者。工具制作者通过特定任务的一些演示来创建通用和可复用的工具(作为Python函数实现)。对于工具使用阶段,该阶段涉及一个轻量级且具有成本效益的模型(例如GPT-3.5 Turbo),用作工具使用者。工具使用者利用验证后的工具来解决任务的不同实例⁶。
这种方法不仅增强了LLM解决问题的能力,并能够显著降低处理一系列任务的平均计算成本。此外,Python函数时一种更通用的思维链,增强了整体效用和灵活性,因此可用于解决涉及算法推理能力
可能存在多种合理方式继续写下去,以下仅为一种可能:
大语言模型的挑战
尽管LATM框架为LLM提供了一个创新和有效的方法来生成和使用工具,但它也面临着一些挑战和局限性。首先,在生成Python函数时,LLM需要遵循正确且合法 的语法规则,并确保函数可以执行且无错误。这可能需要LLM具备一定程度 的编程知识和调试能力⁶。其次,在选择合适 的工具时,LLM需要判断任务类型和难度,并评估不同 的工具之间 的优劣。这可能需要LLM具备一定程度 的元认知和元学习能力⁸。最后,在使用外部工具时, LLM需要注意保护用户隐私和数据安全,并避免生成或传播有害或不真实 的信息。这可能需要LLM具备一定程度 的道德和责任感⁷。
大语言模型的前景
总之, LATM框架为LLM开辟了一个新颖且有前景 的研究方向, 模仿了人类在创建和使用工具方面 的进化飞跃, 为开辟使用LLM生成 的工具 的社区提供了无限可能。 随着技术 的不断发展, 我们期待看到更多更强大 的大语言模型, 不仅可以生成文字, 还可以生成图像、音频、视频等多媒体内容, 并与用户进行更自然、更智能、更友好 的交互。 我们也希望看到更多更负责任 的研究者和开发者, 不仅关注技术 的创新和效果, 还关注技术 的安全和影响, 并与社会共同探讨如何合理地利用和管理这些强大而复杂 的人造智能系统。
大语言模型能力提高,各种AI应用体验和质量会提高,工具也更简单实用。最重要的是学习运用各种AI工具,大幅释放生产力。 想上手使用new bing,了解更多AI技术、应用和ChatGPT进展,欢迎点击如下链接加入
GPT4快速上手体验