Grok 3:速度惊人,但“最聪明”之名言过其实?

2025-03-05 11:08:18 大型语言模型 author

马斯克旗下xAI公司最新发布的Grok 3大型语言模型,号称“地球上最聪明的人工智能”,引发广泛关注。官方宣称其在多个基准测试中超越GPT-4o、Gemini-2 Pro等竞争对手,并在Chatbot Arena中取得第一名。然而,这一说法受到质疑,部分用户及OpenAI的研究人员对其测试结果的真实性和方法提出异议。

《每日经济新闻》记者对Grok 3进行了实际测试,结果显示其确实达到了世界顶级模型的水平,但在数学、逻辑推理和编程能力方面,与其他顶尖模型如DeepSeek R1的差距并不显著。Grok 3的优势在于其极快的响应速度,这在测试中得到验证。

在简单的数学题(例如比较9.9和9.11的大小)上,Grok 3轻松胜出;但在一些更复杂的逻辑推理题(例如“弱智吧”类型的题目),Grok 3的表现不及DeepSeek R1;在数学能力测试中,虽然Grok 3表现最佳,但并未明显超越其他模型;在编程能力测试中,Grok 3略胜OpenAI的o1,但差距不大。

总而言之,Grok 3是一款性能强大的AI模型,其速度优势明显,但在“最聪明”这一说法上,仍有待商榷。其实际表现与官方宣传之间存在一定差距,马斯克的言论或许存在夸大成分。

发表评论:

最近发表