马斯克旗下xAI公司最新发布的Grok 3大型语言模型,号称“地球上最聪明的人工智能”,引发广泛关注。官方宣称其在多个基准测试中超越GPT-4o、Gemini-2 Pro等竞争对手,并在Chatbot Arena中取得第一名。然而,这一说法受到质疑,部分用户及OpenAI的研究人员对其测试结果的真实性和方法提出异议。
《每日经济新闻》记者对Grok 3进行了实际测试,结果显示其确实达到了世界顶级模型的水平,但在数学、逻辑推理和编程能力方面,与其他顶尖模型如DeepSeek R1的差距并不显著。Grok 3的优势在于其极快的响应速度,这在测试中得到验证。
在简单的数学题(例如比较9.9和9.11的大小)上,Grok 3轻松胜出;但在一些更复杂的逻辑推理题(例如“弱智吧”类型的题目),Grok 3的表现不及DeepSeek R1;在数学能力测试中,虽然Grok 3表现最佳,但并未明显超越其他模型;在编程能力测试中,Grok 3略胜OpenAI的o1,但差距不大。
总而言之,Grok 3是一款性能强大的AI模型,其速度优势明显,但在“最聪明”这一说法上,仍有待商榷。其实际表现与官方宣传之间存在一定差距,马斯克的言论或许存在夸大成分。
东北证券首席经济学家付鹏近期在汇丰银行发表的演讲引发广泛关注,其核心...
算力已成为国家竞争力的重要标志,人工智能时代的到来更是加速了全球在算...
中粮资本发布了中粮信托有限责任公司2024年财务报表(未经审计),这...
币安官方推出了一项活动,只要使用币安Web3钱包参与Ton生态,就能...
在汽车电路中正确安全地连接电灯线至关重要,这不仅关系到电路的正常运行...