大模型中的Chat Completion模型和参数

2023-12-26 21:42:13

在大语言模型领域，这种根据提示来预测对应的文字输出的过程，被称为Completion，中文译为“补全”。
能够完成Completion过程的模型，则被成为Completion模型。
OpenAI在Completion模型模型基础上，进一步微调训练得到了对话类模型，也就是Chat Completion模型。相比Completion模型，
Chat Completion模型在大量对话预料上进行了微调训练，
并且在模型内部新增了system、user和assistant等参数，用于设置聊天语境及不同的聊天角色，从而使得模型能够更好的理解人类意图，
从而更好的完成对话类任务。
import os
import openai

openai.api_key = os.getenv("OPENAI_API_KEY")
response = openai.Completion.create(
? ? ? ? ? ?model="text-davinci-003",
? ? ? ? ? ?prompt="Say this is a test"
? ? ? ? ? ?)
生成式大模型的结果往往是无法复现的。尽管从理论上来说，当temperature取值为0的时候，模型在每个步骤中总是选择最可能的下一个token，
这会导致生成的文本变得确定和可预测，
但在实践过程中，由于模型内部的计算精度和舍入误差等因素，也可能无法完全保证结果的完全一致性。
在函数中设置model和prompt参数，这两个是必填的参数。其中model表示调用的模型，而prompt则表示提示词。
参数n （就返回n个completion）
参数temperature （temperature参数是非常核心的用于控制模型输出结果随机性的参数。其取值范围在0-2之间，默认值为1，数值越大模型随机性越大）
参数presence_penalty （presence_penalty更多的是控制返回语句的精炼程度。presence_penalty参数在[-2,2]中取值，数值越大，返回结果越精炼，数值越小，返回结果越啰嗦）
一些大语言模型具备三种不同的模式，分别为精确模式、平衡模式和创造力模式（例如早期的Bing AI聊天），其功能的实现都是通过大模型的参数调整来完成的，而支持这些不同模式功能实现的最基础的两个参数就是presence_penalty参数和temperature参数。

参数best_of （best_of能够让一个模型预测多组结果，并择优进行输出：例子：如果设置best_of=6，则代表总共创建6个备选文本，再从中选取概率最大（得分最高）的一组进行输出）

返回结果response包含了text_completion id（completion任务编码），以及返回结果和模型参数。

文章来源:https://blog.csdn.net/weixin_43882788/article/details/135231354
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！