扫码下载
BTC $76,479.36 -0.47%
ETH $2,287.73 -0.01%
BNB $623.90 -0.04%
XRP $1.38 -0.96%
SOL $84.02 -0.14%
TRX $0.3219 -0.83%
DOGE $0.0999 +0.71%
ADA $0.2471 -0.09%
BCH $452.45 +1.10%
LINK $9.24 -0.32%
HYPE $40.15 -1.99%
AAVE $96.27 -0.44%
SUI $0.9247 -0.35%
XLM $0.1617 -1.83%
ZEC $336.09 -3.43%
BTC $76,479.36 -0.47%
ETH $2,287.73 -0.01%
BNB $623.90 -0.04%
XRP $1.38 -0.96%
SOL $84.02 -0.14%
TRX $0.3219 -0.83%
DOGE $0.0999 +0.71%
ADA $0.2471 -0.09%
BCH $452.45 +1.10%
LINK $9.24 -0.32%
HYPE $40.15 -1.99%
AAVE $96.27 -0.44%
SUI $0.9247 -0.35%
XLM $0.1617 -1.83%
ZEC $336.09 -3.43%

OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

2025-02-23 11:03:04
收藏

ChainCatcher 消息,据金十报道,OpenAI 的一名员工公开指责马斯克旗下的xAI公司,称其发布的最新 AI 模型 Grok3 的基准测试结果具有误导性。对此,xAI 的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。

xAI 的图表显示,Grok3 的两个版本——Grok3 Reasoning Beta 和 Grok3 mini Reasoning——在 AIME 2025 上的表现超过了 OpenAI 当前最强的可用模型 o3-mini-high。然而,OpenAI 的员工很快在 X 平台上指出,xAI的图表并未包含 o3-mini-high 在“cons@64”条件下的 AIME 2025 得分。

巴布什金在 X 平台上辩称,OpenAI 过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

app_icon
ChainCatcher 与创新者共建Web3世界