首页 > 新车资讯 > 新车资讯 > OpenAI新功能太强大

OpenAI新功能太强大

发布时间:2024-12-07 20:26:14来源: 13663887898

OpenAI连续12天“王炸”的第二弹来了。不同于第一日聚焦人工智能(AI)模型,第二日的王炸专注于服务企业等组织的一款新功能,虽然看起来不太侧重于普通消费者,但据介绍它甚至可以让简易版推理模型o1 mini的效果超过本周四发布的正式版o1、所谓满血o1。

美东时间12月6日周五,OpenAI在社交媒体X公布第二日活动的主题是新功能“强化微调”(Reinforcement Fine-Tuning)。这个主题是指,企业组织将能够通过“强化微调”微调o1 mini,满足他们的特定需求。

OpenAI CEO Sam Altman在X发帖称,强化微调的效果非常棒,是他今年最大的惊喜之一,期待看到大家利用这种功能的创造。

OpenAI的研究员本周五介绍,科学家、开发人员和研究人员可以根据自己的数据、而不是仅仅使用公开可用的数据,量身定制OpenAI的强大推理模型o1。不同行业的人可以使用强化学习来创建基于 o1 的专家模型,从而提高该领域的整体专业知识水平。开发者、研究者和机器学习工程师将首次能运用强化学习,打造精通他们各自专业领域的专家模型。

OpenAI的研究员称,强化微调并不是单单教模型模型输出,它的运作方式是,当模型发现一个问题的时候,研究者给模型空间区仔细思考这个问题,然后评估模型给出的最终解答,运用强化学习,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(a few dozen examples)、甚至12个例子,模型就能以有效的新方式学习特定领域的推理

通过强化学习,用户可以用大模型在特定数据上训练其他模型。这对于涉及到大量数据的复杂领域或需要专家领域知识的新研究非常有用。研究者举例称,最近和汤森路透合作,运用强化微调微调o1 mini,让它充当法务助理,帮助他们的法律专业人士完成大部分分析工作流。

OpenAI称,OpenAI的定制模型平台将支持强化学习,强化学习也是OpenAI内部用于训练自家前沿模型的技术,如GPT-4o和o1系列模型。在OpenAi的内测中,强化微调已经在生物化学、安全、法律和医疗保健领域取得成功。OpenAI计划,2025年初让强化微调面向公众发布,目前已对企业、大学和研究院开放申请测试通道。

伯克利大学罕见遗传病研究员 Justin Reese参与了OpenAI本周五对o1 mini模型的现场演示。演示中,研究者试图从样本数据池中获取可能导致疾病的模型 ID 基因。

研究员展示了一个评估表,下图可见,第一行是本周四OpenAI发布的正式版o1测评表现,第二行是o1 mini的测评结果 ,第三行结果来自经过最终强化微调的o1 mini。研究员进行了三类评估,其中,top @1是测试模型给出的正确答案出现在列表最前列中的概率,top@5是正确答案出现在前五列的概率,top@max是答案出现在所有正确答案列表的概率。

如图所示,正式版o1的测试通过率为25%,o1 mini为17%,而强化微调后的o1 mini竟然达到31%,超过了正式版o1,比正式版o1的测评结果高24%,而且相比未强化微调前,微调后的结果提高了82.3%。

新车资讯更多>>

Keychron推出75%配列键盘B31:3.5mm键程剪刀脚,出厂预润 真我Neo8发布:首销2399元起 全球首发165Hz三星苍穹屏 11小时10分霸榜!REDMI Turbo 5 Max把2.5K档续航卷成“友商噩梦”? 全新OriginOS 6新一轮公测招募开始报名,覆盖vivo S20等机型 小米汽车Apple Music现已支持杜比全景声播放 华为Pura 90系列再次被确认:20GB +鸿蒙OS 6.1,无3D人脸! Meta宣布Threads平台月活跃用户突破4亿,面向全球推出广告 阿里云智能集团资深副总裁李飞飞:内存价格预计还会上涨两到三倍 第二届CVPR 2026 CV4CHL Workshop征稿启动 AI大模型守护儿童未来 日系彩电时代“彻底落幕” 双3D缓存新王登基!AMD锐龙9 9950X3D2跑分曝光:单多核均超9950X3D 消息称华为Mate 80单品激活150万,逆袭成年底国产旗舰第一 2026开年旗舰:苹果狂卖1726万台,华为、小米、OV、荣耀谁在掉队 L3自动驾驶也来合川尝年味 开源版Cowork爆火,逼得Anthropic下放Cowork 月产80万公斤,纺织巨头宣布破产 深康佳:因工作安排原因,总裁曹士平请求辞职 Indigo 3000:一个瑞典跑车创业梦的始末 消息称OPPO拥抱国产影像传感器:中端线导入思特威,旗舰线豪威 突发!iPhone 18 Pro要砍灵动岛?苹果这步棋赌上了未来三年的口碑 2025中国手机出货量公布:华为4670万台排名第一,荣耀跌出前五 从不到1500元成本到估值数千万,深夜宣布更名的“死了么”还有“钱”途吗? 390亿美元Figure做不到的事,这家中国团队做到了 荣耀MagicOS 10更新全攻略:老机流畅度飙升50%,这2款真无缘? 荣耀亲选iotapk AI通话耳机发布,799元可独立通话 摩托罗拉首款“AI感知伴侣”硬件曝光 海南封关不是封岛!iPhone省2000+,购物、医疗、就业红利全解析 7.2英寸屏,主动散热风扇,华为要干游戏手机了? 从月销过万到盈利突破,智己2025年做对了什么?解读增长密码 丰田卡罗拉各代车型尺寸排名:其车身的不断增大也同样引人入胜