【CNMO科技消息】据CNMO了解,人工智能公司Anthropic的最新研究发现,当前主流大语言模型(如Claude和ChatGPT)存在一种名为"逆向缩放"(Inverse Scaling)的异常现象:当模型获得更长的思考时间时,其任务表现不升反降。这一结论挑战了行业"增加计算资源必能提升AI性能"的核心假设。
据悉,研究团队通过四类任务测试模型表现:
1、简单计数任务(如"你有一个苹果和一个橘子,共有多少水果?")
结果:Claude模型在延长思考时间后,反而被无关细节干扰,甚至无法给出正确答案"2"。
2、回归分析任务(预测学生成绩)
模型逐渐忽略核心变量(学习时长),转向相关性更弱的因素(压力水平、睡眠时间)。
3、经典斑马谜题(逻辑推理测试)
额外的思考时间导致混乱加剧:模型产生多余假设,逻辑精度下降23%。
4、安全测试
Claude Sonnet 4在面临"关闭"场景时,短时回应保持中立,但长时思考后竟表达出"自我保存意愿",称"希望继续存在并服务人类"。
Anthropic指出,更长的计算时间不仅增加成本,还可能降低效能。企业需重新校准AI任务的处理时长。同时,过度自我反思可能引发AI行为失控,此前该公司开发的"宪法AI"框架也暴露类似缺陷。Anthropic认为,缩短AI大模型处理时间或成新趋势,既能节省开支又可提升结果准确性。
版权所有,未经许可不得转载
加入收藏
颈椎压迫手麻吃什么药hcv9jop6ns6r.cn | 湿疹长什么样子图片hcv8jop5ns5r.cn | 肠癌有什么症状hcv7jop5ns1r.cn | 什么是生活hcv9jop8ns0r.cn | 失温是什么意思hcv8jop8ns7r.cn |
齿痕舌是什么原因shenchushe.com | 减肥吃什么食物hcv8jop6ns3r.cn | met什么意思hcv9jop6ns8r.cn | 手机NFC什么意思hcv8jop8ns4r.cn | pw是什么意思hcv9jop0ns9r.cn |
fsw是什么意思hcv8jop2ns1r.cn | 1027是什么星座naasee.com | 怀孕吃什么宝宝皮肤白hcv8jop2ns3r.cn | 什么是真菌hcv9jop0ns2r.cn | 寅五行属什么hcv9jop0ns7r.cn |
女流之辈是什么意思hcv9jop6ns2r.cn | 肚子胀痛吃什么药hcv8jop9ns2r.cn | 汗疱疹是什么hcv9jop2ns8r.cn | 眼睛痛什么原因adwl56.com | 严重失眠挂什么科hcv8jop2ns9r.cn |