模型
概述
OpenAI API由一组不同能力和价格的多样化模型驱动。您还可以通过微调对我们原始基础模型进行有限定制,以适应您特定的用例。
模型 | 描述 |
---|---|
GPT-4 | 有限测试版 一组模型,比 GPT-3.5 更加优化,能够理解并生成自然语言或代码。 |
GPT-3.5 | 一组模型,改进了 GPT-3 并能够理解和生成自然语言或代码 |
DALL·EBeta | 一个模型,可以根据自然语言提示生成和编辑图像 |
WhisperBeta | 一个模型,可以将音频转换为文本 |
嵌入式模型 | 一组可将文本转换为数字形式的模型 |
适度性 | 经过微调的模型,可以检测文本是否可能敏感或不安全 |
GPT-3 | 一组能够理解并生成自然语言的模型 |
CodexDeprecated | 一组能够理解并生成代码的模型,包括将自然语言翻译成代码 |
我们还发布了开源模型,包括Point-E、Whisper、Jukebox和CLIP。
请访问我们的模型索引以了解更多关于哪些模型被列入我们的研究论文以及InstructGPT和GPT-3.5等不同系列之间的区别。
GPT-4 有限测试版
GPT-4 是一个大型多模态模型(目前接受文本输入和输出,未来将支持图像输入),可以比我们以前的任何模型更准确地解决困难问题,这要归功于它更广泛的通用知识和先进的推理能力。与gpt-3.5-turbo
类似,GPT-4 针对聊天进行了优化,但也适用于传统完成任务。在我们的聊天指南中学习如何使用 GPT-4。
GPT-4目前处于有限的测试版阶段,只对获得许可的用户开放。请加入等待列表,在容量可用时获取访问权限。
最新型号 | 描述 | 最大标记数 | 训练数据 |
---|---|---|---|
gpt-4 | 比任何GPT-3.5模型更强大,能够执行更复杂的任务,并针对聊天进行了优化。将使用我们的最新模型迭代进行更新。 | 8,192个标记 | 截至2021年9月 |
gpt-4-0314 | gpt-4在2023年3月14日的快照。与gpt-4不同,该模型将不会接收更新,并且仅支持为期三个月,于2023年6月14日结束。 | 8,192个标记 | 截至2021年9月 |
gpt-4-32k | 具有与基本gpt-4模式相同的功能,但上下文长度增加了四倍。将使用我们的最新模型迭代进行更新。 | 32,768个标记 | 截至2021年9月 |
gpt-4-32k-0314 | 是2023年3月14日的gpt-4-32快照。与"gpt-4-32k"不同,该模型将不会接收更新,并且仅在2023年6月14日结束的三个月期间内得到支持。 | 具有32768个标记 | 截至2021年9月 |
对于许多基本任务而言,GPT-4 和 GPT-3.5 模型之间的差异并不显著。然而,在更复杂的推理情境中,GPT-4 要比我们以前的任何模型都更具有能力。
GPT-3.5
GPT-3.5模型可以理解和生成自然语言或代码。我们在GPT-3.5系列中最具能力和成本效益的模型是gpt-3.5-turbo
,它已经针对聊天进行了优化,但也适用于传统的完成任务。
最新型号 | 描述 | 最大标记数 | 训练数据 |
---|---|---|---|
gpt-3.5-turbo | 最强大的GPT-3.5模型,针对聊天进行了优化,成本仅为text-davinci-003的1/10。将使用我们的最新模型迭代进行更新。 | 4,096个标记 | 截至2021年9月 |
gpt-3.5-turbo-0301 | gpt-3.5-turbo在2023年3月1日的快照。与gpt-3.5-turbo不同,该模型将不会接收更新,并且只支持三个月期限内(截至2023年6月1日)。 | 4,096个标记 | 截至2021年9月 |
text-davinci-003 | 可以完成任何语言任务,质量更好、输出更长、指令遵循更一致,比curie、babbage或ada模型都要好。还支持在文本中插入完成内容。 | 4,097个标记 | 截至2021年6月 |
text-davinci-002 | 具有类似于text-davinci-003的功能,但是通过监督微调而非强化学习进练 | 4,097个标记 | 截至2021年6月 |
code-davinci-002 | 针对代码补全任务进行了优化 | 8,001个标记 | 截至2021年6月 |
我们建议使用gpt-3.5-turbo
而不是其他GPT-3.5模型,因为它的成本更低。
OpenAI 模型是非确定性的,这意味着相同的输入可能会产生不同的输出。将温度设置为 0 将使输出大多数变得确定性,但仍可能存在一小部分可变性。
特定功能模型
虽然新的gpt-3.5-turbo
模型针对聊天进行了优化,但它在传统的完成任务方面也表现出色。原始的 GPT-3.5模型则是为文本补全而优化。
我们用于创建嵌入和编辑文本的端点使用自己专门的一组模型。
寻找合适的模型
尝试使用gpt-3.5-turbo
是发现API能力的好方法。在你有了想要实现的想法后,你可以继续使用gpt-3.5-turbo
或其他模型,并尝试优化其能力。
您可以使用GPT比较工具,它可以让您并排运行不同的模型以比较输出、设置和响应时间,然后将数据下载到Excel电子表格中。
DALL·E Beta
DALL·E是一种人工智能系统,可以根据自然语言描述创建逼真的图像和艺术作品。我们目前支持以下功能:在给定提示的情况下,创建具有特定大小的新图像、编辑现有图像或创建用户提供图像的变体。
我们API提供的当前DALL·E模型是第二代,比原始模型更加真实、准确,并且图像分辨率增加了4倍。您可以通过我们的实验室界面或API进行尝试。
耳语 Beta
耳语是一种通用的语音识别模型。它经过大量不同类型音频数据集的训练,同时也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。目前我们的API中提供了Whisper v2-large模型,并使用whisper-1
作为其名称。
目前,Whisper 的开源版本和通过我们的 API 可用的版本之间没有区别。但是,通过我们的 API,我们提供了一个优化的推理过程,使得通过我们的 API 运行 Whisper 比其他方式更快。有关 Whisper 的更多技术细节,请阅读论文。
嵌入
嵌入是文本的数字表示,可用于衡量两个文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002
旨在以较小成本替换先前的16个一代嵌入模型。 嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。 您可以在公告博客文章中了解更多关于我们最新嵌入模型的信息。
审查
审查模型旨在检查内容是否符合OpenAI的使用政策。该模型提供分类能力,可寻找以下类别的内容:仇恨、仇恨/威胁、自残、性行为、未成年人性行为、暴力和暴力/图形。您可以在我们的审查指南中了解更多信息。
调节模型接受任意大小的输入,自动分割以适应模型特定的上下文窗口。
模型 | 描述 |
---|---|
text-moderation-latest | 最强大的审核模型。准确率将略高于稳定模型。 |
text-moderation-stable | 几乎与最新模型一样强大,但稍微旧一些。 |
GPT-3
GPT-3模型可以理解和生成自然语言。这些模型被更强大的GPT-3.5代模型所取代。然而,原始的GPT-3基础模型(davinci
、curie
、ada
和babbage
)目前是唯一可用于微调的模型。
最新型号 | 描述 | 最大标记数 | 训练数据 |
---|---|---|---|
text-curie-001 | 非常有能力,比Davinci更快、成本更低。 | 2,049个标记符号 | 截至2019年10月 |
text-babbage-001 | 能够完成简单任务,速度非常快,成本较低。 | 2,049个标记符号 | 截至2019年10月 |
text-ada-001 | 能够完成非常简单的任务,通常是GPT-3系列中最快的模型,并且成本最低。 | 2,049个标记符号 | 截至2019年10月 |
davinci | 最强大的GPT-3模型。可以执行其他模型可以执行的任何任务,并且通常具有更高质量。 | 2,049个标记符号 | 截至2019年10月 |
curie | 非常有能力,但比Davinci更快、成本更低。 | 2,049个标记符号 | 截至2019年10月 |
babbage | 能够完成简单任务,速度非常快,成本较低。 | 2,049个标记符号 | 截至2019年10月 |
ada | 能够完成非常简单的任务,通常是GPT-3系列中最快的模型,并且成本最低。 | 2,049个标记符号 | 截至2019年10月 |
废弃的 Codex
Codex 模型现已被废弃。它们是我们 GPT-3 模型的后代,可以理解和生成代码。它们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。了解更多信息。
他们最擅长Python,精通十多种语言,包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL甚至Shell。
以下的 Codex 模型现已被弃用:
最新型号 | 描述 | 最大标记数 | 训练数据 |
---|---|---|---|
code-davinci-002 | 最强大的Codex模型。特别擅长将自然语言翻译成代码。除了完成代码外,还支持在代码中插入补全内容。 | 8,001个标记 | 截至2021年6月 |
code-davinci-001 | code-davinci-002的早期版本 | 8,001个标记 | 截至2021年6月 |
code-cushman-002 | 几乎与Davinci Codex一样强大,但速度略快。这种速度优势可能使它更适合实时应用程序。 | 高达2,048个标记 | |
code-cushman-001 | code-cushman-002的早期版本 | 高达2,048个标记 |
欲了解更多,请访问我们的Codex工作指南。
模型端点兼容性
终端 | 模型名称 |
---|---|
/v1/chat/completions | gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301 |
/v1/completions | text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada |
/v1/edits | text-davinci-edit-001, code-davinci-edit-001 |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/fine-tunes | davinci, curie, babbage, ada |
/v1/embeddings | text-embedding-ada-002, text-search-ada-doc-001 |
/v1/moderations | text-moderation-stable, text-moderation-latest |
这个列表不包括我们的第一代嵌入模型和DALL·E模型。
连续的模型升级
随着gpt-3.5-turbo
的发布,我们的一些模型现在正在不断更新。为了减少模型变化对用户产生意外影响的可能性,我们还提供了保持静态状态长达3个月周期的模型版本。随着新模型更新节奏的出现,我们也赋予人们贡献评估以帮助我们改进适用于不同用例的模型能力。如果您有兴趣,请查看OpenAI Evals存储库。
以下模型是临时快照,将在指定日期停用。如果您想使用最新的模型版本,请使用标准的模型名称,如gpt-4或gpt-3.5-turbo。
模型名称 | 弃用日期 |
---|---|
gpt-3.5-turbo-0301 | 2023年6月1日 |
gpt-4-0314 | 2023年6月14日 |
gpt-4-32k-0314 | 2023年6月14日 |