什么是提示工程(Prompt Engineering)?

01/12/2024

要想更好地理解什么是提示工程,我们首先需要理解什么是生成式AI,大语言模型,以及什么是提示(Prompt)。

什么是生成式人工智能(Generative AI)?

生成式人工智能,或说生成式AI,是一类人工智能模型,它能够根据给定的输入文本或指令生成相应的输出。与传统的基于规则或模板的系统不同,生成式AI模型可以自主地生成全新的文本、图像、音频等内容,而不仅仅是根据预先定义的规则进行匹配或填充。

什么是大语言模型(Large Language Model, LLM)?

大语言模型是生成式AI的一种,乃基于超大量数据进行训练的人工智能模型,能够极大程度模仿人类思维和语言习惯,并持续在使用过程中进行学习和迭代,专注于处理和生成人类语言的连续文本。

什么是提示(Prompt)?

提示(prompt)是指提供给生成式AI模型的输入文本或指令。它可以是一个问题、一句话、一段文字或者一个完整的段落,用来引导模型生成相应的回答或输出。提示的作用是告诉模型需要完成什么任务或者产生什么样的结果。


什么是提示工程(Prompt Engineering)?

根据以上的讨论,我们可以了解到,通过设计合适的提示,可以引导模型生成特定主题的文章、回答特定问题或者进行有意义的对话。提示的质量和准确性对于生成出符合预期的结果非常重要。

提示工程(Prompt Engineering)是指通过提示(Prompt)的开发和优化,与LLM进行交互,以引导其产生所期望的结果,而无需对模型进行更新。

提示工程可以帮助研究人员提升大型语言模型在处理复杂任务时的能力,比如问答和算术推理,或者提升生成式AI模型在特定任务场景下的性能和效果。通过合理设计和使用提示工程,可以赋能大模型,获得更加符合期待的结果,使其更好地适应各种任务和应用场景。


提示工程的基础要素

由于提示工程是通过对提示进行修改来达到目标,我们首要需要了解的就是提示。提示的写法多种多样,其中有四个重要要素:

  • 提示工程中的提示可以包含以下要素:指令:明确说明希望语言模型执行的特定任务或指令。
  • 上下文:提供外部信息或额外的上下文,以引导语言模型更好地理解和响应。
  • 输入数据:包括用户输入的内容或问题,作为模型生成输出的依据。
  • 输出指示:指定所期望的输出类型或格式。

需要注意的是,提示的具体格式取决于所需任务类型,不是所有上述要素都是必需的。根据任务的不同,您可以选择包含适当的要素来指导语言模型的行为和输出结果。以下,我们使用一个例子来进行说明:


提示工程案例

提问:

0-1.png

返回的内容为:

0-2.jpg

这是一个很广泛的与中国新年有关的答案,主要解释了时间、传统、活动、以及影响等。

接下来,我们想要更具体的关于新年的起源的说明,那我们就进一步将指令内容进行细化,即上文提到的第一种要素:

0-3.jpg

结果:

0-4.jpg

在增加了“起源”这个定语之后,大模型返回的内容就变得更加确切,主要介绍了起源的农历原因以及传说。

那如果是想要编写一个针对小朋友的科普段落,我们就可以增加上下文信息,并对输出的结果进行进一步的规范:

0-5.jpg

在上下文信息和输出结果的约束下,我们得到了以下的内容:

0-6.jpg

以上即为一个非常简单的prompt engineering的例子,即我们可以如何通过修改和规范提示(Prompt)来获得想要的结果。

在基础的提供更多具体信息、上下文信息、规范输出之外,还有很多Prompt Engineering的技术。我们以下介绍几个重要的提示工程技术。


提示工程的重要技术

零样本提示

在我们上一部分的实例中,我们一直使用的是零样本提示,即我们并没有提出例子,只是对内容和结果进行描述。

少样本提示

虽然很多大模型已经能够对零样本提示做出优秀的应对,但是在结果差强人意的时候,我们可以提出样本,作为“上下文提示”的一种方法,来规范大模型给出的结果。

最常见的案例包括对新词进行解释和造句,以及对内容进行分类、情绪判断等。

但是少样本提示也有局限性,即对需要多重推理的问题,如算术题和推理题,有时无法进行正确的推理。在这种情况下,思维链提示(Chain of Thoughts Prompting)就成为了非常重要的新技术。

思维链提示(Chain of Thoughts Prompting)

Wei等人(2022)提出了思维链提示(Chain of Thoughts Prompting)的概念,通过引入中间推理步骤,实现了对复杂推理能力的增强。

这种方法可以与少样本提示相结合,以取得更优秀的结果,特别适用于需要进行更复杂推理的任务。即描述一系列中间推理步骤,人工构建推理过程,使得大型模型能够通过学习这些推理过程,在算数推理、常识推理、符号推理等任务中取得更理想的结果。

然而,由于人工构建推理的过程需要耗费相对较多的时间和人力,这种方法应用得并不广泛。未来的发展应该致力于提高思维链训练的质量和效率,以更好地应对各种复杂推理问题。


澳鹏Prompt Engineering服务

澳鹏作为26年的人工智能数据服务商,创建了Prompt Engineering的定制服务,包括指令标注、指令泛化、以及COT描述等,为您的大模型推出提供全面支持。如想了解,请联系我们的专家,为您的需求进行方案定制。

澳鹏支持全栈式大模型数据服务,包括数据集,模型评估,模型调优;同时,澳鹏智能大模型开发平台与全套标注工具支持您快速部署大模型应用。