模型
旗舰模型
GPT-4o
GPT-4o mini (新)
模型概览
模型 | 描述 |
---|---|
GPT-4o | 我们的高智能旗舰模型,适用于复杂的多步骤任务 |
GPT-4o mini | 我们实惠且智能的小模型,适用于快速、轻量级任务 |
GPT-4 Turbo 和 GPT-4 | 之前的一组高智能模型 |
GPT-3.5 Turbo | 一种快速、廉价的简单任务模型 |
DALL·E | 一种可以根据自然语言提示生成和编辑图像的模型 |
TTS | 一组可以将文本转换为自然语音音频的模型 |
Whisper | 一种可以将音频转换为文本的模型 |
Embeddings | 一组可以将文本转换为数值形式的模型 |
Moderation | 一种经过微调的模型,可以检测文本是否可能敏感或不安全 |
GPT base | 一组没有指令跟随的模型,可以理解和生成自然语言或代码 |
Deprecated | 已弃用模型的完整列表,以及建议的替代品 |
持续的模型升级
gpt-4o
、gpt-4o-mini
、gpt-4-turbo
、gpt-4
和 gpt-3.5-turbo
指向各自的最新模型版本。您可以通过发送请求后查看响应对象来验证这一点。响应将包括所使用的具体模型版本(例如,gpt-4o-mini-gpt-4-turbo-gpt-4-gpt-3.5-turbo-gpt-3.5-turbo-1106
)。GPT-4o
模型 | 描述 | 上下文窗口 | 最大输出令牌 | 训练数据 |
---|---|---|---|---|
gpt-4o | GPT-4o. 我们的高智能旗舰模型,适用于复杂的多步骤任务。GPT-4o 比 GPT-4 Turbo 更便宜、更快。目前指向 gpt-4o-2024-05-13 | 128,000 tokens | 4,096 tokens | 截至 2023 年 10 月 |
gpt-4o-2024-05-13 | gpt-4o 目前指向此版本。 | 128,000 tokens | 4,096 tokens | 截至 2023 年 10 月 |
gpt-4o-2024-08-06 | 支持结构化输出的最新快照。 | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 |
gpt-4o-gpt-4o-2024-08-06
前提前三周通知。GPT-4o mini
gpt-3.5-turbo
更智能但速度相同。它旨在用于较小的任务,包括视觉任务。gpt-3.5-turbo
的地方选择 gpt-4o-mini
,因为此模型更强大且更便宜。模型 | 描述 | 上下文窗口 | 最大输出令牌 | 训练数据 |
---|---|---|---|---|
gpt-4o-mini | 新 GPT-4o-mini。我们实惠且智能的小模型,适用于快速、轻量级任务。GPT-4o mini 比 GPT-3.5 Turbo 更便宜且更强大。目前指向 gpt-4o-mini-2024-07-18 | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 |
gpt-4o-mini-2024-07-18 | gpt-4o-mini 目前指向此版本。 | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 |
GPT-4 Turbo 和 GPT-4
gpt-3.5-turbo
类似,GPT-4 针对聊天进行了优化,但也适用于使用 Chat Completions API 的传统完成任务。请在我们的文本生成指南中了解如何使用 GPT-4。模型 | 描述 | 上下文窗口 | 最大输出令牌 | 训练数据 |
---|---|---|---|---|
gpt-4-turbo | 最新的 GPT-4 Turbo 模型,具有视觉功能。视觉请求现在可以使用 JSON 模式和函数调用。目前指向 gpt-4-turbo-2024-04-09 | 128,000 tokens | 4,096 tokens | 截至 2023 年 12 月 |
gpt-4-turbo-2024-04-09 | GPT-4 Turbo with Vision 模型。视觉请求现在可以使用 JSON 模式和函数调用。目前指向此版本。 | 128,000 tokens | 4,096 tokens | 截至 2023 年 12 月 |
gpt-4-turbo-preview | GPT-4 Turbo 预览模型。目前指向 gpt-4-0125-preview | 128,000 tokens | 4,096 tokens | 截至 2023 年 12 月 |
gpt-4-0125-preview | GPT-4 Turbo 预览模型,旨在减少模型不完成任务的“懒惰”情况。了解更多。 | 128,000 tokens | 4,096 tokens | 截至 2023 年 12 月 |
gpt-4-1106-preview | GPT-4 Turbo 预览模型,具有改进的指令跟随、JSON 模式、可重复输出、并行函数调用等功能。这是一个预览模型。了解更多。 | 128,000 tokens | 4,096 tokens | 截至 2023 年 4 月 |
gpt-4 | 目前指向 gpt-4-0613 。参见持续的模型升级。 | 8,192 tokens | 8,192 tokens | 截至 2021 年 9 月 |
gpt-4-0613 | 2023 年 6 月 13 日的 gpt-4 快照,改进了函数调用支持。 | 8,192 tokens | 8,192 tokens | 截至 2021 年 9 月 |
gpt-4-0314 | 2023 年 3 月 14 日的 gpt-4 旧版快照。 | 8,192 tokens | 8,192 tokens | 截至 2021 年 9 月 |
多语言能力
GPT-3.5 Turbo
gpt-4o-mini
应代替 gpt-3.5-turbo
使用,因为它更便宜、更强大、多模态且同样快速。gpt-3.5-turbo
仍然可以在 API 中使用。模型 | 描述 | 上下文窗口 | 最大输出令牌 | 训练数据 |
---|---|---|---|---|
gpt-3.5-turbo-0125 | 最新的 GPT-3.5 Turbo 模型,在响应请求格式上具有更高的准确性,并修复了导致非英语语言函数调用出现文本编码问题的错误。了解更多。 | 16,385 tokens | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo | 目前指向 gpt-3.5-turbo-0125 。 | 16,385 tokens | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-1106 | GPT-3.5 Turbo 模型,具有改进的指令跟随、JSON 模式、可重复输出、并行函数调用等功能。了解更多。 | 16,385 tokens | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-instruct | 具有类似 GPT-3 时代模型的能力。兼容旧的 Completions 端点,而不是 Chat Completions。 | 4,096 tokens | 4,096 tokens | 截至 2021 年 9 月 |
DALL·E
模型 | 描述 |
---|---|
dall-e-3 | 最新的 DALL·E 模型,于 2023 年 11 月发布。了解更多。 |
dall-e-2 | 之前的 DALL·E 模型,于 2022 年 11 月发布。DALL·E 的第二次迭代,图像比原始模型更逼真、准确,分辨率提高了 4 倍。 |
TTS
tts-1
针对实时文本到语音用例进行了优化,tts-1-hd
针对质量进行了优化。这些模型可以与音频 API 中的 Speech 端点一起使用。模型 | 描述 |
---|---|
tts-1 | 最新的文本到语音模型,优化了速度。 |
tts-1-hd | 最新的文本到语音模型,优化了质量。 |
Whisper
whisper-1
。Embeddings
模型 | 描述 | 输出维度 |
---|---|---|
text-embedding-3-large | 最强大的 embedding 模型,适用于英语和非英语任务 | 3,072 |
text-embedding-3-small | 比第二代 ada embedding 模型性能提高 | 1,536 |
text-embedding-ada-002 | 最强大的第二代 embedding 模型,取代了 16 个第一代模型 | 1,536 |
Moderation
模型 | 描述 | 最大令牌数 |
---|---|---|
text-moderation-latest | 目前指向 text-moderation-007 | 32,768 |
text-moderation-stable | 目前指向 text-moderation-007 | 32,768 |
text-moderation-007 | 最强大的审核模型,涵盖所有类别。 | 32,768 |
GPT Base
模型 | 描述 | 最大令牌数 | 训练数据 |
---|---|---|---|
babbage-002 | 替代 GPT-3 和基础模型。 | 16,384 tokens | 截至 2021 年 9 月 |
davinci-002 | 替代 GPT-3 和基础模型。 | 16,384 tokens | 截至 2021 年 9 月 |
我们如何使用您的数据
默认使用政策按端点
端点 | 用于训练的数据 | 默认保留 | 是否有资格进行零保留 |
---|---|---|---|
/v1/chat/completions* | 否 | 30 天 | 是,除 (a) 图像输入或 (b) 为结构化输出提供的模式* |
/v1/assistants | 否 | 30 天 ** | 否 |
/v1/threads | 否 | 30 天 ** | 否 |
/v1/threads/messages | 否 | 30 天 ** | 否 |
/v1/threads/runs | 否 | 30 天 ** | 否 |
/v1/vector_stores | 否 | 30 天 ** | 否 |
/v1/threads/runs/steps | 否 | 30 天 ** | 否 |
/v1/images/generations | 否 | 30 天 | 否 |
/v1/images/edits | 否 | 30 天 | 否 |
/v1/images/variations | 否 | 30 天 | 否 |
/v1/embeddings | 否 | 30 天 | 是 |
/v1/audio/transcriptions | 否 | 零数据保留 | - |
/v1/audio/translations | 否 | 零数据保留 | - |
/v1/audio/speech | 否 | 30 天 | 是 |
/v1/files | 否 | 直到客户删除 | 否 |
/v1/fine_tuning/jobs | 否 | 直到客户删除 | 否 |
/v1/batches | 否 | 直到客户删除 | 否 |
/v1/moderations | 否 | 零数据保留 | - |
/v1/completions | 否 | 30 天 | 是 |
gpt-4o
、gpt-4o-mini
、gpt-4-turbo
或 gpt-4-vision-preview
模型(或之前的 response_format
)的图像输入不符合零保留资格。当启用结构化输出时,提供的模式(无论是作为 response_format
还是在函数定义中)不符合零保留资格,尽管完成本身符合。模型端点兼容性
端点 | 最新模型 |
---|---|
/v1/assistants | 所有 GPT-4 和 GPT-3.5 Turbo 模型。该工具需要 retrieval (及后续日期模型版本)或 gpt-4-turbo-preview (及后续版本)。 |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/audio/speech | tts-1, tts-1-hd |
/v1/chat/completions | gpt-4 和日期模型版本,以及日期模型版本,以及日期模型版本,gpt-4-turbo-preview 的微调版本 |
/v1/completions (Legacy) | gpt-3.5-turbo-instruct, babbage-002 , davinci-002 |
/v1/embeddings | text-embedding-3-small, text-embedding-3-large , text-embedding-ada-002 |
/v1/fine_tuning/jobs | gpt-3.5-turbo, babbage-002 , davinci-002 |
/v1/moderations | text-moderation-stable, text-moderation-latest |
/v1/images/generations | dall-e-2, dall-e-3 |
修改于 2024-08-11 18:04:34