QRコードをスキャンしてダウンロードしてください。
BTC $77,648.85 +1.28%
ETH $2,339.92 +2.37%
BNB $629.04 +0.96%
XRP $1.40 +1.16%
SOL $85.34 +1.93%
TRX $0.3232 +0.06%
DOGE $0.1096 +10.34%
ADA $0.2529 +2.75%
BCH $454.91 +1.74%
LINK $9.39 +1.62%
HYPE $40.59 +0.73%
AAVE $98.09 +0.60%
SUI $0.9360 +1.24%
XLM $0.1640 +0.16%
ZEC $335.06 -0.33%
BTC $77,648.85 +1.28%
ETH $2,339.92 +2.37%
BNB $629.04 +0.96%
XRP $1.40 +1.16%
SOL $85.34 +1.93%
TRX $0.3232 +0.06%
DOGE $0.1096 +10.34%
ADA $0.2529 +2.75%
BCH $454.91 +1.74%
LINK $9.39 +1.62%
HYPE $40.59 +0.73%
AAVE $98.09 +0.60%
SUI $0.9360 +1.24%
XLM $0.1640 +0.16%
ZEC $335.06 -0.33%

マスクはAIのトレーニングデータが尽きたという見解に同意し、合成データが未来の方向性になると述べた。

2025-01-09 19:18:27
コレクション

ChainCatcher のメッセージによると、TechCrunch の報道で、イーロン・マスクは Stagwell の会長マーク・ペンとのライブ対話の中で、現在の AI モデルのトレーニングは実世界のデータをほぼ使い果たしており、「私たちは人類の知識の蓄積の総和を使い尽くしました。これは昨年に起こりました。」と述べました。マスクは、前 Open AI のチーフサイエンティストであるイリヤ・サツケバーと同じ見解を持っており、彼は NeurIPS 機械学習会議で AI 業界が「データのピーク」に達しており、今後はモデル開発の方法を変える必要があると提案しました。

マスクは、合成データが実データを補完する手段になると考えており、AI は生成と自己評価データを通じて自己学習を実現すると述べています。この傾向は、マイクロソフト、Meta、Open AI、Anthropic などのテクノロジー大手によって採用されており、マイクロソフトの Phi-4 モデルやグーグルの Gemma モデルは、実データと合成データを組み合わせてトレーニングされています。ガートナーは、2024年の AI および分析プロジェクトの約 60% のデータが合成生成されると予測しています。

合成データの利点にはコスト削減が含まれます。例えば、AI スタートアップの Writer は、ほぼ完全に合成データに基づく Palmyra X 004 モデルを開発するのに約 70 万ドルを費やしましたが、同規模の Open AI モデルの開発コストは約 460 万ドルです。しかし、合成データにはリスクもあり、モデルの創造性の低下、出力の偏りの悪化、そして潜在的なモデルの崩壊が含まれます。特に、トレーニングデータ自体に偏りがある場合、生成結果にも影響を与える可能性があります。

app_icon
ChainCatcher Building the Web3 world with innovations.