如何拥有自己的大模型

2023-12-25 18:25:16

尝试了一下调用、调试文心一言大模型，挺简单的。以下是从零开始的调用流程

1.前期准备

1创建百度智能云账号

网址：百度智能云-云智一体深入产业 (baidu.com)

进入网址后，按官网提示正常进行就行，这个应该不算难

2.实名认证

网址：百度智能云-云智一体深入产业 (baidu.com)

进入用户中心处，找到实名认证进行认证，上传身份证信息与照片即可，其余邮箱、电话等账号绑定依据个人口味添加

3 服务开通

在申请使用权限确认后，进入服务开通界面，点击立即使用

点击下一步确认订单

公测账号都有测试代金券，不必担心产生额外费用，服务开通成功页面如下所示

2.调用官方大模型

在创建自己的模型前要先学会调用官方的大模型

网址：百度智能云控制台 (baidu.com)

1.创建应用接入

进入应用接入模块，点击创建应用

按顺序输入信息即可，这里推荐服务配置全选，如果第一次使用，应该是没有在线服务的，这点不需要担心

创建完成之后会生成AK（API Key）与SK（Secret Key），后续会使用

2.平台调用模型

网址：百度智能云控制台 (baidu.com)

根据自己需求在模型广场自行选择模型即可。在本文例子中我尝试ERNIE-Bot 4.0模型

选择模型后点击即可，进入界面后点击体验即可

这个时候会出现两种情况.1.?已开通付费? ? ?2.未开通付费

未开通付费

已开通后通过对话框可直接使用，未开通会受到界面提示点击开通即可

这里说明一下，不同模型收费标准不一样，根据需要购买即可

我开通的是ERNIE-Bot大模型公有云在线调用服务和ERNIE-Bot-turbo-0922大模型公有云在线调用服务和ChatGLM2-6B-32K大模型公有云训练服务-SFT-全量更新。后续如果出现对应服务未开通情况自行按需求开通即可

开通完成后

直接进行对话即可

3.本地代码调用

在确定好在官网可以正常使用，即可在本地环境（安装好对应包）进行尝试

准备阶段

这个时候就需要两样东西：AK（API Key）与SK（Secret Key）

在官方文档中，可以使用不同语言调用不同模型

网址：API列表 - 千帆大模型平台 | 百度智能云文档 (baidu.com)

python示例

以下是python示例（作者主修python）

目前我发现用户可修改三处地方

1.AK? ? ?2.SK? ? ? ?3.url

AK与SK均在应用接入时生成，直接更换即可。指向用户自己，调用密钥，将“xxxx”更换为自己的AK与SK即可

url决定调用模型种类，获取方法如下

网址：百度智能云控制台 (baidu.com)

按图中顺序依次选择。在自己创建的应用最右侧点击移动端测试，选择自己要进行的服务（及大模型），之后官网会自动生成对应的API信息：二维码、请求地址、API Key、Secret Key、模型名称、应用名称。我们需要的即是请求地址，复制请求地址

在下面代码中第十行，main()第一行中的”https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/om82aolq_kubila“部分修改为自己的请求地址即可

url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/om82aolq_kubila?access_token=" + get_access_token()

import requests
import json

API_KEY = "xxxx"
#  API_KEY
SECRET_KEY = "xxxx"
#  SECRET_KEY

def main():       
    url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token=" + get_access_token()
    payload = json.dumps({
        "messages": [
            {
                "role": "user",
                "content": "介绍一下你自己"
            }
        ]
    })
    headers = {
        'Content-Type': 'application/json'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)    
    print(response.json()["result"])
    
def get_access_token():
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

if __name__ == '__main__':
    main()

本地调用

在本地环境进行运行即可调用，可根据需求进行修改问题与界面

修改代码

比如修改代码后在新的命令窗口或网页调用（自行修改代码即可）

from flask import Flask, render_template, request
import requests
import json
from PyQt5.QtCore import Qt
from PyQt5.QtWidgets import QApplication, QWidget, QVBoxLayout, QLabel, QTextEdit, QPushButton, QHBoxLayout, \
    QScrollArea
app = Flask(__name__)
API_KEY = "xxxx"
SECRET_KEY = "xxxx"
class ChatWindow(QWidget):
    def __init__(self):
        super().__init__()
        self.setWindowTitle('Chat')
        self.setStyleSheet("""
            background-color: lightblue;
            font-family: Arial, sans-serif;
        """)
        self.init_ui()
    def init_ui(self):
        main_layout = QVBoxLayout()
        chat_window = QScrollArea()
        chat_window.setWidgetResizable(True)
        chat_window.setVerticalScrollBarPolicy(Qt.ScrollBarAlwaysOn)
        chat_window.setHorizontalScrollBarPolicy(Qt.ScrollBarAlwaysOff)
        chat_container = QWidget()
        chat_layout = QVBoxLayout(chat_container)
        chat_window.setWidget(chat_container)
        main_layout.addWidget(QLabel('<h1>糖患卫士</h1>'))
        main_layout.addWidget(chat_window)
        input_layout = QHBoxLayout()
        prompt_input = QTextEdit()
        prompt_input.setPlaceholderText("输入消息")
        input_layout.addWidget(prompt_input)
        send_button = QPushButton("发送")
        input_layout.addWidget(send_button)
        main_layout.addLayout(input_layout)
        self.setLayout(main_layout)
        send_button.clicked.connect(lambda: self.add_message('user', prompt_input.toPlainText()))
        prompt_input.returnPressed.connect(send_button.click)
    def add_message(self, role, content):
        message_box = QTextEdit(content)
        message_box.setReadOnly(True)
        message_box.setStyleSheet("""
            background-color: white;
            padding: 20px;
            border-radius: 5px;
            margin-bottom: 20px;
        """)
        if role == 'user':
            message_box.setAlignment(Qt.AlignLeft)
        else:
            message_box.setAlignment(Qt.AlignRight)
        chat_container = self.findChild(QWidget, 'chat_container')
        chat_layout = chat_container.layout()
        chat_layout.addWidget(message_box)
        scroll_bar = self.findChild(QScrollArea).verticalScrollBar()
        scroll_bar.setValue(scroll_bar.maximum())
def main(prompt):
    url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/om82aolq_kubila?access_token=" + get_access_token()
    payload = json.dumps({
        "messages": [
            {
                "role": "user",
                "content": prompt
            }
        ]
    })
    headers = {
        'Content-Type': 'application/json'
    }
    response = requests.request("POST", url, headers=headers, data=payload)
    return eval(response.text.replace('false','"false"'))['result']
def get_access_token():
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

@app.route('/')
def index():
    return render_template('index.html')

@app.route('/submit', methods=['POST'])
def submit():
    prompt = request.form['prompt']
    content = main(prompt)
    return {'role': 'bot', 'content': content}

if __name__ == '__main__':
    chat_window = ChatWindow()
    app = QApplication([])
    chat_window.show()
    app.run()

C++语言示例

准备与修改内容同上

#include <stdio.h>
#include <iostream>
#include <string.h>
#include <curl/curl.h>
#include <json/json.h>
#include <fstream>
#include <memory>

std::string client_id = "xxx";
std::string client_secret = "xxx";

inline size_t onWriteData(void * buffer, size_t size, size_t nmemb, void * userp)
{
    std::string * str = dynamic_cast<std::string *>((std::string *)userp);
    str->append((char *)buffer, size * nmemb);
    return nmemb;
}


std::string getAccessToken()
{
    std::string result;
    CURL *curl;
    CURLcode res;
    curl = curl_easy_init();
    if(curl)
    {
        curl_easy_setopt(curl, CURLOPT_CUSTOMREQUEST, "POST");
        curl_easy_setopt(curl, CURLOPT_URL, "https://aip.baidubce.com/oauth/2.0/token");
        curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
        curl_easy_setopt(curl, CURLOPT_DEFAULT_PROTOCOL, "https");
        struct curl_slist *headers = NULL;
        headers = curl_slist_append(headers, "Content-Type: application/x-www-form-urlencoded");
        headers = curl_slist_append(headers, "Accept: application/json");
        curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);
        std::string data = "grant_type=client_credentials&client_id="+client_id+"&client_secret="+client_secret;
        curl_easy_setopt(curl, CURLOPT_POSTFIELDS, data.c_str());
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, &result);
        curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, onWriteData);
        res = curl_easy_perform(curl);
    }
    curl_easy_cleanup(curl);
    Json::Value obj;
    std::string error;
    Json::CharReaderBuilder crbuilder;
    std::unique_ptr<Json::CharReader> reader(crbuilder.newCharReader());
    reader->parse(result.data(), result.data() + result.size(), &obj, &error);
    return obj["access_token"].asString();
}

int main(int argc, char *argv[])
{
    std::string result;
    CURL *curl;
    CURLcode res;
    curl = curl_easy_init();
    if(curl) {
        curl_easy_setopt(curl, CURLOPT_CUSTOMREQUEST, "POST");
        curl_easy_setopt(curl, CURLOPT_URL, ("https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token=" + getAccessToken()).c_str());
        curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
        curl_easy_setopt(curl, CURLOPT_DEFAULT_PROTOCOL, "https");
        struct curl_slist *headers = NULL;
        headers = curl_slist_append(headers, "Content-Type: application/json");
        curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);
        const char *data = "{\"messages\":[{\"role\":\"user\",\"content\":\"介绍一下你自己\"},{\"role\":\"assistant\",\"content\":\"您好，我是文心一言，英文名是ERNIE Bot。我能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。\"}]}";
        curl_easy_setopt(curl, CURLOPT_POSTFIELDS, data);
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, &result);
        curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, onWriteData);
        res = curl_easy_perform(curl);
        std::cout<<result;
    }
    curl_easy_cleanup(curl);
    return (int)res;
}

GO示例

package main

import (
    "encoding/json"
    "fmt"
    "io/ioutil"
    "net/http"
    "strings"
)
const API_KEY = "RgAq3HSxxxxDlvXOoLy"
const SECRET_KEY = "zWSdXWxxxxKmkRWi8YORj"

func main() {

    url := "<https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token=>" + GetAccessToken()
    payload := strings.NewReader(``)
    client := &http.Client {}
    req, err := http.NewRequest("POST", url, payload)

    if err != nil {
        fmt.Println(err)
        return
    }
    req.Header.Add("Content-Type", "application/json")

    res, err := client.Do(req)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer res.Body.Close()

    body, err := ioutil.ReadAll(res.Body)
    if err != nil {
        fmt.Println(err)
        return
    }
    fmt.Println(string(body))
}

/**
 * 使用 AK，SK 生成鉴权签名（Access Token）
 * @return string 鉴权签名信息（Access Token）
 */
func GetAccessToken() string {
    url := "<https://aip.baidubce.com/oauth/2.0/token>"
    postData := fmt.Sprintf("grant_type=client_credentials&client_id=%s&client_secret=%s", API_KEY, SECRET_KEY)
    resp, err := http.Post(url, "application/x-www-form-urlencoded", strings.NewReader(postData))
    if err != nil {
        fmt.Println(err)
        return ""
    }
    defer resp.Body.Close()
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        fmt.Println(err)
        return ""
    }
    accessTokenObj := map[string]string{}
    json.Unmarshal([]byte(body), &accessTokenObj)
    return accessTokenObj["access_token"]
}

其它

错误码

如果请求错误，服务器返回的JSON文本包含以下参数。

名称	描述
error_code	错误码
error_msg	错误描述信息，帮助理解和解决发生的错误

例如Access Token失效返回以下内容，需要重新获取新的Access Token再次请求。

{
  "error_code": 110,
  "error_msg": "Access token invalid or no longer valid"
}

千帆大模型平台相关错误码，请查看错误码说明。

4.自己微调大模型

网址：百度智能云控制台 (baidu.com)

1.数据集准备

网址：百度智能云控制台 (baidu.com)

在微调大模型前需要准备好自己的数据集json文件、txt文件、csv文件、xlsx文件、压缩包文件（本文已json文件为例

进入网址后，点击图中创建数据集按钮

根据个人要求进行命名，选择数据类型、标注类型、标注模板、保存位置等等，完成后点击创建并导入即可

构建方式、数据标注状态、导入方式、导入格式后直接上传即可，这里采取有标注信息的json文件采取本地导入的方式。

json文件格式数据要求如下

1. 文件内单条数据格式要求为[{"prompt" : "prompt内容", "response": [["response内容"]]}]，?下载数据样例。
2. 每一行表示一组数据，每组数据中的prompt和response加起来之和字符数不超过32000Token（包括中英文、数字、符号等），超出部分将被截断。
3. 支持文本文件类型为jsonl，编码仅支持UTF-8，单次上传限制100个文本文件，单个文件不超过100M

[{"prompt": "xxxx", "response": [["xxxx"]]}]
[{"prompt": "xxxx", "response": [["xxxx"]]}]
[{"prompt": "xxxx", "response": [["xxxx"]]}]
[{"prompt": "xxxx", "response": [["xxxx"]]}]
[{"prompt": "xxxx", "response": [["xxxx"]]}]

按照上述方式上传后，等待一分钟左右数据导入完成。如若无需修改，选择发布即可，发布完成后，数据集上传已完成，进入下一步模型训练。

2.模型训练

网址：百度智能云控制台 (baidu.com)

导入数据及后开始将新数据进行模型训练，按下图选择任务名称、任务类型任务描述、选择基础模型、模型版本（这里模型要选择自己开通过的，否则要从新开通）

训练配置可选择增量训练（仅支持选择2023年9月22日后训练的模型。同时由于大模型权重占用较大存储，只能选择三个月内训练的模型发起增量训练），

训练方法分为两种：1.全量更新（全量更新在训练过程中对大模型的全部参数进行更新）2.

LoRA（LoRA在固定预训练大模型本身的参数的基础上，在保留自注意力模块中原始权重矩阵的基础上，对权重矩阵进行低秩分解，训练过程中只更新低秩部分的参数。）建议选择LoRA）

其余数据配置按需要选择，数据集这是可选择第一步构造的“我的数据集”，选择完之后进行付费训练即可。这里注意是否开通对应服务，若未开通，在确定按钮右侧选择“前往开通“即可。

点击确定并付费后会进行训练，这里时间可能会较长，训练完成后即可进入下一步

等待模型训练完成后，将模型发布，即可开启大模型服务

创建的大模型可在我的模型处查看并编辑

网址：百度智能云控制台 (baidu.com)

3.开启大模型服务

在模型创建并发布成功后，即可开启大模型服务

网址：百度智能云控制台 (baidu.com)

进入在线服务界面选择我的服务后点击创建服务即可

进入创建界面后，1.输入服务名称（任意、支持中文、英文、数字、中划线(-)、下划线(_)，1-20个字符以内），2.选择模型，3.这里选择我的模型，在这里会看到我们上一步发布的模型，4.输入API地址（这里按格式要求命名即可），5.选择资源池，这里选择私人资源池，6.随后选择开通的时间（这里我感觉这个消费还是比较贵的，哎），可以选的对应天数与小时，最低一个小时，我这里28元。7.点击确定后付费即可（注册时的20元代金卷可以使用）

模型服务发布需要等待几分钟

点击服务详情后复制标注出的服务地址，下一步会使用。

到这里模型已经发布

4.调用大模型服务

这里直接参考上述本地代码调用即可

?在下面代码中第十行，main()第一行中的”https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/om82aolq_kubila“部分修改为自己的请求地址即可（及上一步复制信息）

url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/om82aolq_kubila?access_token=" + get_access_token()

在调用前要保证应用接入AK与SK的服务要包含自己新开通的服务即可调用

作者新尝试调用大模型，如有错误拜托大家及时联系，希望能帮到大家

文章来源:https://blog.csdn.net/m0_73701759/article/details/135186861
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！