你使用过大语言模型(LLM)吗?你或许对这个名字并不熟悉,但你一定多少听过热门的 ChatGPT、文心一言、通义千问等,你也一定无数次在B站刷到过 Kimi 的广告,这些 AI 都被称为“大语言模型”,意味着他们从大量的语言文字数据训练而成,能够胜任常见的自然语言处理任务。在极创工作室,我们就有好几个项目基于大语言模型构建而成。
在本题中,我们希望通过几个小问题来引导你对大语言模型有个初步的认识。请在充分查阅了解之后,在提交框输入你的答案。问题比较多,你可以先在自己的笔记或者编辑器里写好,再复制粘贴进来。
- 到底什么是大语言模型? 用你的方式给这个东西一个定义。
- 什么是 prompt(提示词)? system prompt(系统提示词)和 user prompt(用户提示词)的区别是什么?
- LLM 厂商通常会以两种形式对外提供服务:助手类应用和 API。前者面向普通用户,后者则面向开发者。你认为这两种使用 LLM 的方式,最显著的区别是什么?
- 我们很容易知道,LLM 在训练完成之后,内部的知识便已经冻结,既然如此, 为什么基于 LLM 的 AI 助手仍然能够给出实时的信息?(提示:function calling)
- 市面上的 AI 助手允许你提交一个特别大的文档并且使用 LLM 查阅和分析里面的内容,但是 LLM 普遍有着“上下文窗口”(context window),这个参数代表着输入模型的文本的最长上限。既然有着这个限制,AI 助手们是如何有效处理超大文档的呢?(提示:RAG)
- 在 AI 助手应用中,你常会遇到智能体(agent)的概念,结合以上内容,给出你对 agent 的定义。
- (选做)结合以上内容,试解释目前面向用户的 AI 助手的实质。
- (选做)在以上题目中,你会注意到我们仍然局限在“用户与模型相互对话”的思维。但是实际上,模型并不会“对话”,模型只会“续写”!请查阅 Transformer 模型的基本原理和指令微调的基本概念(无需了解具体算法内容),给出你对“模型只会续写”这句话的理解。