大模型答数学题“翻车”

2024-10-17 00:00

作文周刊(高考版) 2024年35期

近日，一道小学数学题让AI大模型集体“失智”了。9.11和9.9两个数字哪个更大？就此问题，国内外12个大模型之中只有4个答对了，剩下8个全都回答错误。一道小学数学题难倒了一众海内外AI大模型，这在舆论场激起了不小涟漪。有人“惊掉下巴”，调侃“大模型集体翻车”；也有人质疑AI的能力边界，甚至上手测试了一番，结果发现答案对错都有，有些大模型能迅速“承认错误”，而有的则“一错到底”。

原因总结起来有二：一是技术。大模型在分析文本时，通常会使用特定机制将文本拆分成更小的单元，然后再进行处理。这就类似于将一句话拆成一个个词汇去理解。我们都知道，很多词语脱离特定语境，意思可能就变了，所以会有“断章取义”的误解。同理，大模型的这种拆分处理，显然不够严谨。二是训练数据。现如今，大模型更多是以文本模型进行训练分析，在数理分析、逻辑推理上还有待优化。

素材解读

我们要学会对技术“祛魅”，不论是大模型，还是其他人工智能技术，虽然产品琳琅满目，但大部分尚处在测试探索期，距离真正成熟、好用还有一定距离。所谓“祛魅”，就是保持“人间清醒”，既不过分迷信技术特质，也不盲目夸大技术功用，而是在客观判断和合理运用中，让技术应用成为我们的最佳“搭档”。

适用话题

人工智能、理性思维、客观判断、合理运用

作文周刊(高考版)2024年35期

作文周刊(高考版)的其它文章: 让非遗传下去、深扎根、结硕果; 承历代之典籍，显中国之力量; 把脉2024年高考作文命题特点; 读史明智，运用逻辑思维; 答吴充秀才书; 尚志斋说（节选）