AI大模型在基础数学问题上的挑战：9.11与9.9比较引发的思考-联想知识库

联想服务 Think服务大客户服务联想官网

AI大模型在基础数学问题上的挑战：9.11与9.9比较引发的思考

适用机型：台式 / 笔记本

知识编号：4223722024-07-18

催更新

一、问题的提出

一个简单的数学问题“9.11和9.9哪个大？”却难倒了许多先进的AI大模型。这一问题最初由Scale AI的高级提示工程师Riley Goodside提出，并迅速在AI界引起了广泛的关注和讨论。

二、测试结果

通过对包括GPT-4o、Claude 3.5 Sonnet、Gemini在内的多个AI大模型的测试，结果显示许多模型错误地认为9.11大于9.9。例如，GPT-4o在多次测试中坚持认为9.11更大，尽管在后续的追问中能够给出正确的答案。类似的情况也出现在Claude 3.5 Sonnet和谷歌的Gemini模型中。

对比结果.jpg

三、错误原因分析

AI大模型在这一问题上的错误可能源于多个方面。首先，大模型通常基于Transformer架构，依赖于预测下一个词的概率分布，而非直接进行算术计算。其次，分词器在处理数字时可能将其误认为是日期或版本号，导致比较错误。此外，大模型在处理数学问题时可能缺乏必要的逻辑推理能力。

四、提升AI数学能力的方法

为了提升AI的数学推理能力，需要从以下几个方面入手：

高质量的训练数据：提供更多涉及数学计算和逻辑推理的训练数据。
针对性的训练：通过专门设计的语料训练模型，提升其理科能力。
算法优化：改进分词器和算法，确保数字的正确处理和比较。

五、实际应用的影响

AI大模型在基础数学问题上的表现不仅关系到其在学术领域的应用，也影响到其在金融、工业等严肃商业场合的可靠性。提升AI的数学能力，对于确保其在复杂推理和决策中的表现至关重要。

六、结论

AI大模型在处理简单数学问题时的挑战凸显了其在数学推理能力上的局限性。这一问题的发现对于AI模型的开发者和用户来说是一个警示，提示我们需要更加关注模型在不同领域的应用表现，并采取措施提升模型的综合能力。未来，随着技术的进步和更多高质量数据的引入，我们有望看到大模型在数学等领域的表现得到显著提升。

1

知识有用，就点一下~

0

收藏 :

相关知识

1联想浏览器AI助手

2你的AI PC入门指南

3中国AI大模型烧钱战：广告投入上亿，用户留存成难题

4机械键盘的优势及选购

版权所有：1998-2024 联想集团 | 法律公告 | 隐私保护 | 服务声明 | 工具使用许可协议京ICP备11035381

| 使用帮助 | 知识反馈

鑱旀兂浼氬憳鐧诲綍

鐢ㄦ埛鍚嶄笉姝ｇ‘

鐢ㄦ埛娉ㄥ唽鍗忚鍙婇殣绉佹斂绛�

濡傛灉鎮ㄨ緭鍏ョ殑鎵嬫満鍙锋湭娉ㄥ唽锛屽皢涓烘偍杩涜娉ㄥ唽锛屾敞鍐屽嵆琛ㄧず鎮ㄥ悓鎰�銆婃敞鍐屽崗璁€�鍜�銆婇殣绉佹斂绛栥€�

鍚屾剰骞剁户缁�

宸查槄璇诲苟鍚屾剰娉ㄥ唽鍗忚 鍜� 闅愮鏀跨瓥

鎵嬫満楠岃瘉鐮佺櫥褰�璐︽埛瀵嗙爜鐧诲綍

浼佷笟浼氬憳娉ㄥ唽

绔嬪嵆娉ㄥ唽蹇樿瀵嗙爜锛�

鍏朵粬鐧诲綍鏂瑰紡

鑱旀兂浼氬憳鎵爜鐧诲綍

鎵撳紑鑱旀兂鏅洪€堿pp鎵爜杩涜鐧诲綍

鎵弿鎴愬姛!

璇峰嬁鍒锋柊鏈〉闈紝鎸夋墜鏈烘彁绀烘搷浣滐紒

浜岀淮鐮佸凡澶辨晥

鎵爜鐧诲綍鏇村畨鍏�