大模型答数学题“翻车”

2024-10-17 00:00
作文周刊(高考版) 2024年35期

近日,一道小学数学题让AI大模型集体“失智”了。9.11和9.9两个数字哪个更大?就此问题,国内外12个大模型之中只有4个答对了,剩下8个全都回答错误。一道小学数学题难倒了一众海内外AI大模型,这在舆论场激起了不小涟漪。有人“惊掉下巴”,调侃“大模型集体翻车”;也有人质疑AI的能力边界,甚至上手测试了一番,结果发现答案对错都有,有些大模型能迅速“承认错误”,而有的则“一错到底”。

原因总结起来有二:一是技术。大模型在分析文本时,通常会使用特定机制将文本拆分成更小的单元,然后再进行处理。这就类似于将一句话拆成一个个词汇去理解。我们都知道,很多词语脱离特定语境,意思可能就变了,所以会有“断章取义”的误解。同理,大模型的这种拆分处理,显然不够严谨。二是训练数据。现如今,大模型更多是以文本模型进行训练分析,在数理分析、逻辑推理上还有待优化。

素材解读

我们要学会对技术“祛魅”,不论是大模型,还是其他人工智能技术,虽然产品琳琅满目,但大部分尚处在测试探索期,距离真正成熟、好用还有一定距离。所谓“祛魅”,就是保持“人间清醒”,既不过分迷信技术特质,也不盲目夸大技术功用,而是在客观判断和合理运用中,让技术应用成为我们的最佳“搭档”。

适用话题

人工智能、理性思维、客观判断、合理运用