号称最聪明ai今晚公布
$特斯拉 (TSLA.US)$ Grok3在多项基准测试中表现出色,排名领先。在LMSYS大模型竞技场中,Grok3以1400分的高分位居榜首,超越了GPT-4、Claude 3.5 Sonnet和Gemini 2.0 Pro等主流模型。在数学推理、科学逻辑推理和代码写作等能力方面,Grok3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。特别是在推理方面,Grok 3 Reasoning和Grok 3 mini Reasoning在AIME’24、GPQA等测试中取得了压倒性的优势,最高分达到96分,超过了o3 mini(high)、o1和DeepSeek-R1等前沿模型。在最新的AIME 2025评测中,Grok3推理系列模型更是达到了90分以上,略微领先于o3 mini(high)的87分
免责声明:社区由Moomoo Technologies Inc.提供,仅用于教育目的。
更多信息
评论
登录发表评论