OpenAI承认GPT-4变懒，即将发布修复方案提升性能

2023-12-14 21:33:56

1OpenAI承认GPT-4变懒，即将发布修复方案提升性能

**划重点:**

1. 🤯 用户反馈:GPT-4使用者抱怨OpenAI破坏了体验，称模型几乎“害怕”提供答案。

2. 🕵??♂? 问题认知:OpenAI承认性能问题，归因于模型训练数据变化，试图提高准确性却导致意外的懒散行为。

3. ? 修复时间表:OpenAI未明确发布修复计划的确切时间，但强调高度重视，并将密切关注竞争对手，如Google的Gemini1.0。

站长之家（ChinaZ.com）12月11日消息:近期，OpenAI的GPT-4引起了广泛关注，使用者纷纷抱怨模型变得“懒散”且不愿提供答案。OpenAI在社交平台X上承认了这一问题，表示模型自11月11日以来未进行更新，并强调这并非故意设计。

针对用户的批评，OpenAI承认了GPT-4的性能问题，并将其归因于对模型微调所用训练数据的变更。尽管这一变更旨在提高准确性和减少偏见，但却不慎导致了观察到的懒散现象。一些使用者表示，模型似乎变得几乎“害怕”提供答案，而其他人则表示现在需要更精确的提示，而这在以前是可选的。

AI chatGPT 人工智能??由站长之家提供

图源备注:图片由AI生成，图片授权服务商Midjourney

OpenAI为其立场辩护，声称模型自11月12日以来未发生变化，但问题在于“模型行为的差异可能很微妙”，只有特定的提示可能会“退化”。尽管进行了这些修改，但OpenAI警告称使用者和员工可能需要一些时间才能识别这些模式。

至于修复的时间表，OpenAI尚未提供确切的实施计划，但他们强调这是一个高优先级的任务，并正在努力解决问题。OpenAI没有为新的更新模型指定发布日期，但肯定会密切关注竞争对手，特别是Google推出Gemini1.0系列的情况。

GPT-4所面临的挑战突显了开发和部署大型语言模型的复杂性。OpenAI对解决问题的透明度和承诺为未来AI发展提供了宝贵的见解。

2一文秒懂人工智能全球近况

一、数据见证变革

①大模型周度流量分析

国外大模型访问量及页面浏览量：

国外大模型桌面端应用平均访问停留时间：

国内大模型访问量（单位：万）：

国内大模型页面浏览量（单位：万）：

国内大模型桌面端应用平均访问停留时间：

②大模型月度流量分析

Chatgpt及谷歌Bard月度访问量：

百度文心一言及讯飞星火月度访问量：

11月国内外大模型在APP Store下载量及收入：

国外大模型11月总访问量及来源占比：

国外大模型11月独立访客量及页面跳出率：

国外大模型11月流量来源渠道占比：

国内大模型11月总访问量（单位：万）：

国内大模型11月访问量来源占比：

国内大模型11月独立访客量及页面跳出率：

国内大模型11月流量来源渠道占比：

③大模型月度受众分析

国外大模型11月受众性别及年龄分布：

国外大模型11月受众兴趣云图：

国内大模型11月受众性别及年龄分布：

国内大模型11月受众兴趣云图：

④重点应用跟踪

据GPTs Hunter网站统计，截至12月10日，共有34373个GPTs产品。下图为Discord网站上热门AI社区的最新成员数量：

二、周度行业大事

①政策

12月5日，浙江省《数据资产确认工作指南》正式实施，该指南为国内首个针对数据资产确认制定的省级地方性标准；12月9日，欧盟就监管生成式人工智能工具达成初步协议。这是全球首份针对AI监管的全面法规，意在保护人类基本权利和不阻碍人工智能行业发展之间寻求平衡。

②模型

12月4日，Meta推出AI音频模型Audiobox，支持语音及文字同时输入，能生成各种环境音、自然对话语音，并整合了音频生成和编辑能力；12月4日，谷歌发布Translatotron3模型，无需任何并行语音数据，即可实现语音对语音的同声传译；12月7日，谷歌推出多模态大模型Gemini，可以同时无缝理解和操作文字、代码、声音、图片、视频等多元形式的内容；12月9日，Stability AI发布30亿参数轻量模型StableLM Zephyr 3B，可满足从简单查询到边缘设备上的复杂教学语境等各种文本生成需求。

③算力

12月4日，IBM发布新量子运算系统Quantum System Two，将搭载3个量子运算芯片Heron；12月6日，国家超算广州中心发布新一代国产超级计算系统“天河星逸”，该系统以应用为中心，采用国产先进计算架构、高性能多核处理器、高速互连网络、大规模存储等关键技术；12月8日，AMD发布Instinct MI300X加速器。Instinct MI300X加速器由8个MI300X组成，能够提供高达1.5TB的HBM3内存容量，在运行大语言模型推理时的吞吐量和延时表现均优于前代产品。

④应用

12月4日，百度智能云发布基于文心一言的AI原生应用“超级助理”，并已正式开启公测，未来还将推出独立PC端和移动端应用；12月6日，腾讯视频发布自研弹幕引擎芯魔方，通过图像算法AI模型，可实现弹幕效果和画面内容的高契合度，呈现出模拟场景的效果；12月8日，Meta推出PurpleLlama检测套件，提供CyberSec Eval评估工具、Llama Guard输入输出安全分类器，可帮助开发者检测AI安全性；12月8日，微软团队推出下一代生成式AI工具MatterGen，该模型是一种扩散模型，专用于生成新颖、稳定的材料，稳定性超SOTA模型2.9倍。

三、公司公告梳理

中国长城：12月4日，公司下属控股公司长城信息拟向6名原股东定向发行0.17亿股，募集资金0.4亿元。

科大讯飞：12月4日，公司发布关于股权激励计划部分股票期权注销完成的公告，15.409万份股票期权的注销事宜已办理完毕。截至公告披露之日，公司股票期权激励对象人数为65人，激励对象已获授但尚未满足行权条件的股票期权的数量为63.208 万份。

福昕软件：12月4日，公司发布关于获得政府补助的公告，自2023年1月1日至2023年11月30日期间，累计获得政府补助款项共计人民币4,464,369.81元，全部为与收益相关的政府补助。

新致软件：12月4日，公司发布2023年限制性股票激励计划（草案），拟向29人授予1010万限制性股票，占公司总股本的4.15%，授予价格15元/股，分2024-2026三年解锁，业绩考核目标分别为以2022年为基数营收或毛利润增长率不低于25.44%、40.49%、57.35%。

佳发教育：12月4日，公司发布公告称其控股股东、实际控制人袁斌先生将其所持有的本公司部分股份办理了解除质押的业务。

中科曙光：12月6日，公司发布以集中竞价交易方式回购公司股份方案，本次回购的股份拟用于员工持股计划或股权激励。回购资金总额不低于人民币2000万元（含）、不超过人民币3000万元（含）。

紫光股份：12月8日，公司发布关于使用部分闲置自有资金进行委托理财的公告，此次委托理财额度不超过人民币25亿元，将投资于安全性高、流动性好的短期、低风险银行理财产品、无本金损失条款的结构性存款和货币型基金。

大华股份：12月8日，公司发布为子公司提供担保的进展公告，拟在2023年为合并范围内的部分子公司提供担保，担保总额度不超过人民币1,360,000万元。

文章来源:https://blog.csdn.net/mrjieke6/article/details/134935002
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！