OpenAI的新模型幻觉率上升令其困惑（音频）

外星人S博士

OpenAI的新模型幻觉率上升令其困惑（音频）

OpenAI最新的推理模型o3和o4-mini比公司此前的AI系统更频繁地出现“幻觉”，根据内部测试和第三方研究，o3在OpenAI的PersonQA基准测试中出现幻觉的频率为33%，是旧模型o1（16%）和o3-mini（14.8%）的两倍。o4-mini的表现更糟，幻觉率高达48%。非营利性AI实验室Transluce发现o3在声称使用的过程中制造假信息，包括在不使用ChatGPT的情况下在2021年款MacBook Pro上运行代码。斯坦福大学兼职教授Kian Katanforoosh指出，他的团队发现o3经常生成无效的网站链接。 OpenAI在其技术报告中表示，“需要更多的研究”来理解为什么随着推理模型的规模扩大，幻觉现象会加剧。

打开APP收听

OpenAI的新模型幻觉率上升令其困惑（音频）

Netflix首席执行官反驳卡梅隆关于A

西部数据报告：硬盘的环境影响小于固态硬盘

美国研究发现牙膏普遍被铅和其他金属污染（

欧盟立法者匆赴匈牙利出行，获反间谍手机保

研究称气候变化将使大米变得有毒，威胁数十

英国启动海洋碳捕捉项目SeaCURE（音

Q-CTRL发布比GPS精度高50倍的抗

惠普同意支付400万美元和解费以解决'虚

Synology将关键NAS功能锁定在专

假学生盗取美国社区学院逾1100万美元财

任天堂如何通过法庭策略摧毁了Atari游

诺贝尔奖得主Venki Ramakris

Discord在英国和澳大利亚测试面部识

全球首个疫情条约达成 - 美国缺席（音频

OpenAI发布o3及o4-mini模型