使用 OpenAI API 进行快速工程的最佳实践(官方教你怎么问)

提示工程的工作原理

由于指令跟随模型的训练方式或它们训练的数据,有一些特定的提示格式特别有效,并且与手头的任务更好地对齐。下面我们介绍了一些我们发现工作可靠的提示格式,但您可以随意探索可能最适合您的任务的不同格式。

 

 

经验法则和例子

注意:“ {text input here} ”是实际文本/上下文的占位符

 

1.使用最新型号

为获得最佳效果,我们通常建议使用最新、功能最强大的型号。截至 2022 年 11 月,最佳选择是用于文本生成的“text-davinci-003” 模型和用于代码生成的“code-davinci-002”模型。

 

 

2.将指令放在提示符的开头,用###或“””分隔指令和上下文

不太有效的❌:

将下面的文本总结为最重要的要点列表。

{此处输入文字}

 

更好的✅:

将下面的文本总结为最重要的要点列表。

文本:""" 
{此处输入文本} 
"""

 

 

3. 对期望的背景、结果、长度、格式、风格等尽可能具体、描述和详细

具体说明上下文、结果、长度、格式、样式等

 

不太有效的❌:

写一首关于 OpenAI 的诗。

 

更好的✅:

以{著名诗人}的风格写一首关于 OpenAI 的鼓舞人心的短诗,重点介绍最近推出的 DALL-E 产品(DALL-E 是一种文本到图像的 ML 模型)

 

 

4. 通过示例(示例 1示例 2)阐明所需的输出格式。

不太有效的❌:

提取下面文本中提到的实体。提取以下 4 种实体类型:公司名称、人名、特定主题和主题。

文字:{文字}

显示并告知 – 当显示特定格式要求时,模型会更好地响应。这也使得以编程方式可靠地解析出多个输出变得更加容易。

 

更好的✅:

提取下面文本中提到的重要实体。首先提取所有公司名称,然后提取所有人员姓名,然后提取适合内容的特定主题,最后提取一般总体主题所需

格式:
公司名称:<comma_separated_list_of_company_names>
人员名称:-||-
特定主题:-||-
一般主题:-||-

文本:{text}

 

 

5. 从零镜头开始,然后是小镜头(示例),两者都不起作用,然后进行微调

✅ 零射击

从下面的文本中提取关键字。

文本:{text}

关键词:

 

✅ Few-shot – 提供几个例子

从下面相应的文本中提取关键词。

文本 1:Stripe 提供 API,网络开发人员可以使用这些 API 将支付处理集成到他们的网站和移动应用程序中。
关键字 1:Stripe、支付处理、API、Web 开发人员、网站、移动应用程序
##
文本 2:OpenAI 训练了非常擅长理解和生成文本的尖端语言模型。我们的 API 提供对这些模型的访问,可用于解决几乎任何涉及处理语言的任务。
关键词二:OpenAI,语言模型,文本处理,API。
##
文本 3:{text}
关键字 3:

 

✅微调:在此处查看微调最佳实践。

 

 

6. 减少“蓬松”和不精确的描述

不太有效的❌:

这个产品的描述应该很短,只有几句话,不要太多。

 

更好的✅:

使用 3 到 5 句话的段落来描述该产品。

 

 

7.与其说什么不该做,不如说什么该做

不太有效的❌:

以下是代理和客户之间的对话。不要询问用户名或密码。不要重复。

客户:我无法登录我的帐户。
代理人:

 

更好的✅:

以下是代理和客户之间的对话。代理将尝试诊断问题并提出解决方案,同时避免询问与 PII 相关的任何问题。不要询问用户名或密码等 PII,而是让用户参阅帮助文章 www.samplewebsite.com/help/faq

客户:我无法登录我的帐户。
代理人:

 

 

8. 特定于代码生成——使用“引导词”将模型推向特定模式

不太有效的❌:

# 编写一个简单的 python 函数
# 1. 问我一个以英里为单位的数字
# 2. 它将英里转换为公里

 

在下面的代码示例中,向模型添加“ import ”提示它应该开始用 Python 编写。(类似地,“SELECT”是 SQL 语句开始的一个很好的提示。)

 

更好的✅:

# 编写一个简单的 python 函数
# 1. 问我一个以英里为单位的数字
# 2. 它将英里转换为公里
 
import

 

 

参数

通常,我们发现model 和是改变模型输出的最常用参数。 temperature

  1. model更高性能的模型更昂贵并且具有更高的延迟。

  2. temperature衡量模型输出不太可能的标记的频率。越高temperature,输出越随机(并且通常具有创造性)。然而,这与“真实”不同。对于大多数事实用例,例如数据提取和如实问答,temperature0 是最好的。

  3. max_tokens( maximum length) – 不控制输出的长度,而是令牌生成的硬截止限制。理想情况下,您不会经常达到此限制,因为您的模型会在它认为完成时或达到您定义的停止序列时停止。

  4. stop(停止序列) – 一组字符(标记),在生成时会导致文本生成停止。

有关其他参数说明,请参阅API 参考

 

 

其他资源

如果您对其他资源感兴趣,我们建议:

  • 导游

    • 文本补全– 了解如何使用我们的模型生成或编辑文本

    • 代码完成– 探索 Codex 的提示工程

    • 微调– 了解如何为您的用例训练自定义模型

    • 嵌入– 学习如何搜索、分类和比较文本

  • OpenAI cookbook repo – 包含使用 API 完成常见任务的示例代码和提示,包括使用嵌入进行问答

  • 传送门:https://help.openai.com/en/articles/6654000-best-practices-for-prompt-engineering-with-openai-api

© 版权声明

相关文章

暂无评论

none
暂无评论...