提示工程的工作原理
由于指令跟随模型的训练方式或它们训练的数据,有一些特定的提示格式特别有效,并且与手头的任务更好地对齐。下面我们介绍了一些我们发现工作可靠的提示格式,但您可以随意探索可能最适合您的任务的不同格式。
经验法则和例子
注意:“ {text input here} ”是实际文本/上下文的占位符
1.使用最新型号
为获得最佳效果,我们通常建议使用最新、功能最强大的型号。截至 2022 年 11 月,最佳选择是用于文本生成的“text-davinci-003” 模型和用于代码生成的“code-davinci-002”模型。
2.将指令放在提示符的开头,用###或“””分隔指令和上下文
不太有效的❌:
将下面的文本总结为最重要的要点列表。 {此处输入文字}
更好的✅:
将下面的文本总结为最重要的要点列表。 文本:""" {此处输入文本} """
3. 对期望的背景、结果、长度、格式、风格等尽可能具体、描述和详细
具体说明上下文、结果、长度、格式、样式等
不太有效的❌:
写一首关于 OpenAI 的诗。
更好的✅:
以{著名诗人}的风格写一首关于 OpenAI 的鼓舞人心的短诗,重点介绍最近推出的 DALL-E 产品(DALL-E 是一种文本到图像的 ML 模型)
4. 通过示例(示例 1、示例 2)阐明所需的输出格式。
不太有效的❌:
提取下面文本中提到的实体。提取以下 4 种实体类型:公司名称、人名、特定主题和主题。 文字:{文字}
显示并告知 – 当显示特定格式要求时,模型会更好地响应。这也使得以编程方式可靠地解析出多个输出变得更加容易。
更好的✅:
提取下面文本中提到的重要实体。首先提取所有公司名称,然后提取所有人员姓名,然后提取适合内容的特定主题,最后提取一般总体主题所需 格式: 公司名称:<comma_separated_list_of_company_names> 人员名称:-||- 特定主题:-||- 一般主题:-||- 文本:{text}
5. 从零镜头开始,然后是小镜头(示例),两者都不起作用,然后进行微调
✅ 零射击
从下面的文本中提取关键字。 文本:{text} 关键词:
✅ Few-shot – 提供几个例子
从下面相应的文本中提取关键词。 文本 1:Stripe 提供 API,网络开发人员可以使用这些 API 将支付处理集成到他们的网站和移动应用程序中。 关键字 1:Stripe、支付处理、API、Web 开发人员、网站、移动应用程序 ## 文本 2:OpenAI 训练了非常擅长理解和生成文本的尖端语言模型。我们的 API 提供对这些模型的访问,可用于解决几乎任何涉及处理语言的任务。 关键词二:OpenAI,语言模型,文本处理,API。 ## 文本 3:{text} 关键字 3:
✅微调:在此处查看微调最佳实践。
6. 减少“蓬松”和不精确的描述
不太有效的❌:
这个产品的描述应该很短,只有几句话,不要太多。
更好的✅:
使用 3 到 5 句话的段落来描述该产品。
7.与其说什么不该做,不如说什么该做
不太有效的❌:
以下是代理和客户之间的对话。不要询问用户名或密码。不要重复。 客户:我无法登录我的帐户。 代理人:
更好的✅:
以下是代理和客户之间的对话。代理将尝试诊断问题并提出解决方案,同时避免询问与 PII 相关的任何问题。不要询问用户名或密码等 PII,而是让用户参阅帮助文章 www.samplewebsite.com/help/faq 客户:我无法登录我的帐户。 代理人:
8. 特定于代码生成——使用“引导词”将模型推向特定模式
不太有效的❌:
# 编写一个简单的 python 函数 # 1. 问我一个以英里为单位的数字 # 2. 它将英里转换为公里
在下面的代码示例中,向模型添加“ import ”提示它应该开始用 Python 编写。(类似地,“SELECT”是 SQL 语句开始的一个很好的提示。)
更好的✅:
# 编写一个简单的 python 函数 # 1. 问我一个以英里为单位的数字 # 2. 它将英里转换为公里 import
参数
通常,我们发现model
和是改变模型输出的最常用参数。 temperature
-
model
–更高性能的模型更昂贵并且具有更高的延迟。 -
temperature
–衡量模型输出不太可能的标记的频率。越高temperature
,输出越随机(并且通常具有创造性)。然而,这与“真实”不同。对于大多数事实用例,例如数据提取和如实问答,temperature
0 是最好的。 -
max_tokens
( maximum length) – 不控制输出的长度,而是令牌生成的硬截止限制。理想情况下,您不会经常达到此限制,因为您的模型会在它认为完成时或达到您定义的停止序列时停止。 -
stop
(停止序列) – 一组字符(标记),在生成时会导致文本生成停止。
有关其他参数说明,请参阅API 参考。
其他资源
如果您对其他资源感兴趣,我们建议:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...