DeepSeek V3-0324: オープンソース AI で Google Gemini と Claude を超える

主なハイライト パフォーマンスの概要 DeepSeek V3-0324 は、チャットボット、カスタマー サービスの自動化、ライブ翻訳などのリアルタイム シナリオなど、非推論タスクで優れた性能を発揮します。Aider のポリグロット ベンチマークで 55% のスコアを獲得し、Sonnet 3.7 に次ぐスコアを獲得しました。これは、堅牢な知識保持と問題解決を反映しています (Analytics Vidhya)。レイテンシに敏感なコンテキストで独自モデルよりも優れているのは、効率的な MoE アーキテクチャによるものです。 技術の詳細 合計 6,710 億のパラメーターを備え、Multi-Head Latent Attention (MLA) と DeepSeekMoE (GitHub) を介してタスクごとに 370 億のみをアクティブ化します。128k のコンテキスト ウィンドウ (API は 64k で上限) と FP8 精度で 700GB を超える GPU メモリ需要を備え、MIT のライセンスにより幅広い使用と変更が可能です (Hugging Face)。 アプリケーションと将来の可能性 最適化された […]