
著者: Boxu Li
ヨーロッパのAIスタートアップMistral AIが、最先端のコーディングに特化した言語モデルDevstral 2を発表。2025年12月にリリースされたDevstral 2は、完全なオープンウェイトモデルとして登場し、その重み付けはパーミッシブライセンスの下で公開されています[1]。このリリースは、MistralがAIの大手企業に対抗し、OpenAIのCodexやAnthropicのClaudeのような独自モデルに対するオープンな代替手段を提供するという意図を示しています。以下では、Devstral 2のアーキテクチャ、機能、実際の使用例、そしてグローバルに変化するAIの風景における意義について詳しく見ていきます。
Devstral 2は、Mistralの次世代コーディングモデルファミリーを表し、2つのバリエーションで導入されています[1]:
· Devstral 2(123Bパラメーター) – 1230億のパラメーターと256,000トークンのコンテキストウィンドウを備えた密なトランスフォーマーモデル[2]。この大規模モデルは、ハイエンドのデプロイメントや複雑なタスクに向けて設計されており、リアルタイム推論には少なくとも4つのH100 GPU(NVIDIAのフラッグシップAIアクセラレータ)が必要です[3]。
· Devstral Small 2(24Bパラメーター) – 縮小版の24Bモデルで、256Kのコンテキスト長を維持しながら、コンシューマーハードウェアや単一のGPUでも動作可能な軽量モデルです[4][5]。この「Small」バージョンは、ピークパフォーマンスを一部犠牲にしながらも、ローカルおよびエッジでのデプロイを可能にします。
アーキテクチャと機能: 一部の競合モデルが大規模なMixture-of-Experts (MoE)技術を使用しているのとは異なり、Devstral 2は密なトランスフォーマーであり、すべての123Bパラメータを推論ごとに利用できます。MoEシャーディングを使わないにもかかわらず、効率的なトレーニングとコンテキスト管理に注力することで、より大規模なMoEモデルに匹敵するかそれ以上の性能を発揮します。Devstral 2とその小型バージョンは、マルチモーダル入力をサポートしており、特にコードと一緒に画像を受け入れることができ、ソフトウェアタスクにおける図やスクリーンショットの分析などのビジョンとコードのユースケースを可能にします。また、MistralのAPIの一部として、チャット補完、関数呼び出し、インラインコード編集(コード挿入のための中間埋め込みサポートなど)などの業界標準機能もサポートしています。[6][7][8][9].
トレーニングデータ: Mistralはトレーニングレシピ全体を公に詳述していませんが、Devstral 2は明らかにコード集約型のタスクに最適化されています。「コードベースを探索し、複数のファイルを編集するためのツールを使用することに優れたエンタープライズグレードのテキストモデル」として説明されており、自律型のソフトウェアエンジニアリングエージェントを支えるように調整されています[10]。トレーニングにはソースコード、ドキュメント、技術文書の数兆個のトークンが使用されたと推測されます。おそらく、オープンソースのリポジトリから引き出されたもので、競合モデルが80〜90%のコードと残りの自然言語の混合でトレーニングされた方法に似ています[11]。その結果、何百ものプログラミング言語に精通し、大規模なコードプロジェクトを理解するのに長けたモデルが生まれました。
リリース形式とオープンソースライセンス: 重要なことに、Mistralは「オープンウェイト」哲学を続けています[12]。Devstral 2のモデルウェイトは誰でもダウンロードして実行できるように公開されています。主要な123Bモデルは改変MITライセンスの下で提供され、24B Devstral SmallはApache 2.0ライセンスを使用しています[13][1]。両方のライセンスは非常に寛容で、商業利用や改変を許可しています(改変MITはおそらく使用の明確化を追加していると思われます)。これらのモデルをオープンソース化することで、Mistralは*「分散知能の加速」*を目指し、最先端のAIへの幅広いアクセスを確保します[1]。開発者はモデルをセルフホスティングするか、MistralのAPIを利用できます。初期期間中は、Devstral 2のAPIは無料でテスト可能であり、その後、価格は100万入力トークンあたり0.40ドル、100万出力トークンあたり2.00ドルに設定される予定です(Smallモデルではさらに低料金)[14][15]。ウェイトがオープンにされていることで、コミュニティがベンダーロックインなしでモデルを微調整したり統合したりすることが可能です。

Devstral 2は、コーディングと「エージェンティック」な開発ワークフローのために特別に設計されています。コードを生成するだけでなく、ツールを使ってコードベース全体を自律的にナビゲートし、編集し、デバッグすることができます。このモデルは複数ファイルのプロジェクトを扱うために設計されており、多くのソースファイルからコンテキストを読み込み、プロジェクト全体の依存関係を追跡し、リファクタリングでファイル間の変更を調整することさえ可能です[16]。例えば、Devstralは関数が定義されている場所を特定し、すべての呼び出しに更新を伝播し、結果として生じるバグを修正することができます。これは、リポジトリ全体を把握している賢い新人開発者のように振る舞います。実行中のエラーを検出し、出力を改善し、テストが通るまで繰り返します[17]。このレベルのコンテキスト認識と反復的な改善は、いわゆる「バイブコーディング」アシスタントの核心であり、Devstral 2はOpenAIのCodex、MetaのCode Llama、そしてDeepSeek-CoderやKimi K2のような新しいエージェンティックコーダーと競争しています。
ベンチマークパフォーマンス: コーディングベンチマークでは、Devstral 2は世界のトップモデルの一つです。Mistralによると、Devstral 2はSWE-Bench (Verified) suiteで72.2%のスコアを記録しています[2]。SWE-Benchは、解が正確性で検証される実世界のプログラミングタスクの厳格なセットであり、OpenAIのHumanEvalテストの高度なバージョンに相当します。参考までに、OpenAIのオリジナルCodex (2021)は、より簡単なHumanEval問題をpass@1で~28.8%しか解決できませんでした[18] – コーディングAIがどれだけ進化したかを示す証です。MetaのCode Llama 34B (2023)も、その時代の最高のオープンモデルの一つで、HumanEvalで~53.7%を達成しました[19]。Devstral 2のSWE-Benchでの72%は、これらの先駆者を劇的に上回っていることを示しています。実際、Devstralの精度は、今日のプロプライエタリな大手に近づいています。Anthropicの最新のClaude Sonnet 4.5(コーディングに特化したモデル)やGoogleのGeminiは、同様のコーディングベンチマークで70%台中盤から後半に位置しています[20]。
オープン対プロプライエタリなコーディングモデルの性能比較: SWE-Bench Verifiedテストにおいて、Devstral 2 (72.2%)とその24Bの兄弟モデル(68.0%)は、オープンソースモデルの中でトップにランクインしています。彼らはプロプライエタリリーダーであるClaude Sonnet 4.5やGPT-5.1 Codex(AnthropicとOpenAIの最新モデル、約77%)に迫っています。驚くべきことに、Devstral 2は、いくつかの競合モデルのパラメータのほんの一部でこの成果を達成しています。例えば、中国のDeepSeek V3.2(MoEモデル、約236Bの総パラメータ)は精度でわずかにDevstralを上回っていますが(約73.1%)、Devstralは総パラメータの5分の1しか使用していません。同様に、MoonshotのKimi K2(中国の1兆パラメータのMoEモデル)は、32Bのエキスパートを起動しながら約71–72%のスコアを出しましたが、Devstral 2はそれと同等のスコアを123Bの密集モデルで達成しており、規模ははるかに小さいです。この効率性は上記のチャートに反映されています:Devstral 2(赤いバー)は、DeepSeekの5倍、Kimi K2の8倍小さいにもかかわらず、ほぼ最先端の精度を提供しています。つまり、Mistralはコンパクトなモデルが、はるかに大きなモデルに匹敵し得ることを証明しました。これは、コスト効率の良い展開にとって良い兆しです。
並列比較において、Devstral 2はすでに定性的なテストでいくつかのオープンなライバルを上回っています。独立した評価者によって行われた直接対決のコーディングチャレンジでは、Devstral 2はDeepSeek V3.2と比較して、42.8%の勝率に対し、28.6%の敗北率を示し、コード生成の質において明確な優位性を示しました。しかし、AnthropicのClaude Sonnet 4.5に対しては、まだ負けることが多く[23]、オープンなモデルと最高のクローズドモデルとの間にはまだギャップがあることを示しています。AnthropicはClaude Sonnet 4.5を「世界最高のコーディングモデル」として宣伝しており、複雑なソフトウェアエージェントを構築する卓越した能力を持つとしています[24]。オープンソースの愛好者にとって良いニュースは、Devstral 2がこのギャップを大幅に縮小していることです。Mistralは、Devstralが最高のクローズドモデルと同等のツール使用成功率を達成していると述べており、APIを呼び出したり、コマンドを実行したり、ドキュメントを検索したりする能力において競合他社と同様に巧妙であることを意味しています[25]。このエージェントの能力は、静的なコード補完を超えたコーディングタスクの自動化にとって非常に重要です。
Devstral 2のコスト効率も注目に値します。より小型で最適化された設計のおかげで、Mistralは、DevstralがAnthropicのClaude Sonnetに比べて現実のコーディングタスクで最大7倍のコスト効率を持つと主張しています[26]。ここでの効率とは、成功した成果を得るために必要な計算量を指しており、Devstralは同様の結果をより少ないFLOPsまたは低コストのクラウドで達成できるため、スタートアップや予算に敏感なチームにとって魅力的な特性となっています。
Devstral 2は単なる研究成果ではありません。それは、インディーズのコーダーから大企業のチームに至るまで、幅広いソフトウェア開発者にとって即座に役立つようにパッケージ化されています。MistralはこのモデルをMistral Vibe CLIと組み合わせており、Devstralを実践的なコーディングパートナーに変えています[27]。このCLIは(IDE拡張機能およびオープンソースツールとして利用可能)、開発者がAIとコードベースについてチャットし、変更を求めたり、コマンドを実行したりすることをプログラミング環境内で可能にします[28][29]。実際に、Vibe CLIはプロジェクトのファイルを読み取り、gitのステータスを理解し、セッションの持続的な記憶を保持してコンテキストの繰り返しを防ぎます[30]。たとえば、開発者が「ユーザー認証モジュールを追加して」と入力すると、Vibeは必要なファイルを生成し、設定を変更し、依存関係のためにnpm installを実行し、テストを実行することもできます。つまり、自然言語の指示に従って複数のステップが必要なコーディングタスクを自動化します。このような統合された開発アシスタントは、定型作業やリファクタリングの作業を自律的に処理することで、プルリクエストのサイクルを半分に短縮できます[31]。
個人開発者や小規模チーム向けに、Devstral 2(Vibe CLIやVS Codeのようなエディタを通じて)は生産性を劇的に向上させます。即時のコード補完とデバッグアドバイスを提供し、GitHub Copilotに似ていますが、プロジェクト全体の変更に対処する能力がより高いです。また、スマートコード検索をサポートします。埋め込みモデルと自然言語を使用して、関数が使用されている場所を見つけたり、関連するスニペットを提案したりできます(Mistralは以前、この目的のために「Codestral Embed」というコード検索モデルを開発しました[32])。このモデルの持続的な会話メモリは、セッション中にバグや機能についての以前の議論を思い出すことができるため、まるでずっと一緒にいる専門家とペアプログラミングをしているような体験になります。[30]。そして、Devstral Small 2はローカルで実行でき(必要に応じてGPUなしでも)[5]、ホビイストやインディーハッカーはクラウドコストやインターネット接続なしで実験できます。たとえば、ハッカソン中にラップトップでAIアシスタントを完全にオンデバイスで使用してコーディングすることが可能です。
スタートアップ企業にとって、Devstral 2の導入は、ビッグテックのAPIに依存せずに高度なAIコーディング機能を構築する方法を提供します。多くのスタートアップが、AIペアプログラマーやコード自動化を開発パイプラインに組み込むために競っています。Devstralのオープンモデルを使用すれば、自社のサーバーでホストしたり、コミュニティが運営する推論サービスを利用したりして、高額なAPI料金を回避できます。自由なライセンスにより、独自のコードベースでモデルを微調整し、製品に深く統合することが可能です(CodexやClaudeのようなクローズドモデルでは使用制限があるため、これができません)。このモデルはオンプレミス展開とカスタム微調整に対応しており、すぐに利用できます[33]。Mistralのコーディング技術の初期採用者には、Capgeminiやフランス国鉄(SNCF)などが含まれており、彼らはMistralのAIをソフトウェアプロジェクトの支援に使用しています[34]。スタートアップも同様に、Devstralを使用してコードレビューを自動化したり、新しいマイクロサービス用のボイラープレートを生成したり、自然言語のテストケースジェネレーターを構築したりすることが可能です。そして、機密コードは社内に保つことができます。
企業は、Mistralの「プロダクショングレードのワークフロー」に焦点を当てることで大きな利益を得ることができます。大規模な組織はしばしばレガシーシステムと広範なコードベースを持っています。Devstral 2の拡張されたコンテキストウィンドウ(256Kトークン)は、数百ページのコードやドキュメントを一度に取り込むことができるため、企業のコードリポジトリ全体の構造や大規模なAPI仕様を一度に理解する能力を持っています。これは、レガシーコードのモダナイズのようなタスクにおいて非常に重要です。このモデルは、時代遅れのフレームワークからモダンなものへのモジュールのリファクタリングを提案し、数十のファイルを一貫して変更することができます[17]。企業はDevstral 2をファイアウォールの背後にデプロイすることができ(MistralはNVIDIAのDGXと今後のNIMシステム向けに最適化しており、オンプレミスでのスケーリングを容易にします[35])。これにより、コードが会社のインフラストラクチャを離れる必要がないため、データのプライバシーやコンプライアンスに関する懸念が軽減されます。
さらに、信頼性と制御は企業のIT部門にとって重要です。Mistralの共同創設者であるGuillaume Lample氏は、外部のAI API(例:OpenAIのもの)に依存することがリスクであると強調しました。「大企業であれば、2週間ごとに30分のダウンタイムが発生するAPIに依存する余裕はありません」[36]。モデルの展開を自社で行うことにより、企業は安定した稼働時間を得ることができ、ニーズに合わせてパフォーマンスを調整することができます。Mistralはまた、コーディングプラットフォーム用の管理コンソールを提供しており、細かい制御、使用状況分析、チーム管理の機能を備えています[37]。これにより、大規模な組織はAIの使用状況を監視し管理することができます。要するに、Devstral 2は企業のツールキットを強化します:コード保守の自動化から、会社のコードベースに関する質問に答えることで新しい開発者をサポートする知識豊富なコーディングアシスタントとして役立ちます。
Mistral AI は、しばしば「ヨーロッパのチャンピオン AI ラボ」と呼ばれ、急速に力強い存在となっています。同社は、半導体の巨人 ASML が主導する大規模な資金調達ラウンドの後、最近の評価額が117億ユーロ(約138億ドル)に達し、ヨーロッパが独自の AI リーダーシップを持つことに戦略的重要性を置いていることを示しています。多額の資金を調達しているアメリカのラボ(OpenAI は報道によると570億ドルを調達し、驚異的な5000億ドルの評価を受けているのに対して)とは異なり、Mistral は比較的「少額」で運営されています。この財務的な対比が Mistral の戦略に影響を与えています:オープンウェイトモデルと効率重視で、単なる規模ではない。GPT-4 や GPT-5 のような巨大モデルとのパラメータ競争に参加するのではなく、Mistral の哲学は大きければ常に良いわけではない – 特に企業のユースケースにおいては[40]。Lample の説明によれば、多くの企業のタスクは、小規模で調整されたモデルでより安価かつ迅速に処理できる[41]。Devstral 2 はこのアプローチの完璧な例であり、クローズドソースの最先端モデルよりも小型でありながら、企業が重要視するコーディングタスクに最適化されています。
高性能モデルをオープンソース化することで、Mistralはシリコンバレーが支配する閉鎖的なAIパラダイムに対抗する存在としての位置付けをしています。OpenAIやAnthropicの主力モデルは非常に強力ですが、プロプライエタリでAPI経由でしかアクセスできません。Mistralはその閉鎖的なアプローチを明確に拒否しています。「AIが大手研究所だけにコントロールされることを望んでいない」とLample氏は述べています。代わりに、Mistralはモデルの重みを公開し、誰でもモデルを実行し修正できるようにすることで、先進的なAIの民主化を目指しています。この姿勢により、MistralはAIオープンソースエコシステムの中心的な役割を急速に獲得しました。彼らの以前のモデルスイート(2025年12月2日に発売された「Mistral 3ファミリー」)には、675BパラメータのマルチモーダルMoE「Large 3」と9つの小型モデルが含まれており、すべてがオープンにリリースされています。Devstral 2はその基盤の上に構築され、重要なコーディング領域をターゲットにしています。それぞれのリリースが、Mistralのオープンで高品質なAIの先駆者としての評判を固め、「フロンティア」モデルの提供者として、閉鎖的なモデルに匹敵する能力を持っています。
戦略的に、Devstral 2はMistralが業界のパートナーシップを形成し、開発者エコシステムを築くことも可能にします。モデルとともに、MistralはKilo CodeやClineのようなエージェントツールとの統合(自律的なコーディングエージェントのための人気フレームワーク)を発表し、Devstralがこれらのシステムで容易に使用できるようにしています[45]。また、Vibe CLI拡張機能をZed IDEで利用可能にし[46]、開発者が既に働いている場所で彼らに出会うという巧妙な市場アプローチを示しています。彼らの技術をワークフローに組み込み、コミュニティの貢献を促進することで(CLIはオープンソースApache 2.0[47]ライセンスです)、Mistralはエコシステム内での地位を強化しています。これは大手米国ラボとは異なる進め方で、コミュニティの受け入れと信頼を重視しています。Mistralを単なるAIモデルベンダーとしてではなく、AI支援開発のためのプラットフォームビルダーとして位置付け、多くのユーザーや組織が彼らのツールを採用することでネットワーク効果を生む可能性があります。
Devstral 2のリリースは、AIの多極化する世界への移行を強調しています。この世界では、リーダーシップは単一の地域によって支配されるのではなく、アメリカ、中国、ヨーロッパの間で分散されています。これらの各地域は、それぞれ異なる哲学を持って急速に旗艦AIモデルを開発しています。
· アメリカ – クローズドフロンティアモデル: アメリカは最先端モデル能力で依然として先行しており、OpenAIとAnthropicが最前線に立っています。OpenAIのGPT-4(そして期待されるGPT-5シリーズ)は多くのベンチマークの基準を設定していますが、完全に独自所有です。AnthropicのClaude 4とClaude Sonnetは、より安全で推論に特化したAIを専門としており、これもクローズドソースですが、ますますコーディングワークフローをターゲットにしています(例: Sonnet 4.5はコード用に1Mトークンコンテキストを持つ)[48]。これらの企業は管理されたAPIアクセスを好み、大規模なコンピュート予算を持っています。この傾向は、アメリカのAIへの過度の依存について海外で懸念を引き起こしました。興味深いことに、アメリカでもMetaのような企業はLlamaモデルをオープンソース化することでこの傾向に逆らっていますが、最も先進的なシステムの多くは依然としてクローズドです。
· 中国 – オープンイノベーションの急増: 過去2年間で、中国のAIラボはオープンソースリリースへの戦略的な転換を図っており、これは一部には世界的な採用を促進するためであり、一部には西洋の技術への依存を減らすためです。例えば、百度(Baidu)は最近、Apache 2.0の下でマルチモーダルモデル(ERNIE 4.5-VL)をオープンソース化し、GoogleやOpenAIの最新のものに匹敵する視覚と言語のタスクでの性能を主張しています[49][50]。BaiduのモデルはMoEアーキテクチャを使用し、28Bのパラメータのうち約3Bのみを活性化することで非常に効率的です。これにより、単一の80GB GPU上で動作可能です[51][52]。このことは、中国の実用的な展開性とオープンアクセスへの重視を示しており、強力なモデルを守る西洋企業と対照的です。Zhipu AI(中国の著名なAIスタートアップ)も同様にオープンなアプローチを採用しており、そのDeepSeek-Coderシリーズはオープンソースであり、膨大なバイリンガルコードデータセットで訓練されています[53]。DeepSeekの最新バージョンは338のプログラミング言語と128Kのコンテキストを処理でき、コードタスクでGPT-4 Turboに匹敵する性能を主張しています[11]。そのベンチマーク結果によれば、いくつかのコーディングや数学のチャレンジでGPT-4を上回っています[55]。さらに、Moonshot AIのKimi K2は、1兆のパラメータ(MoE)を持つ別の中国のオープンモデルで、コード生成とエージェント問題解決用に設計されています[56]。これらの努力は、中国が急速に独自のGPT-4クラスモデルを生産しており、しばしばオープンまたはセミオープンで、オープンな協力の力を活用して自国のエコシステムを育成し、世界的に競争していることを示しています。
· 欧州連合 – Mistralのオープンウェイト攻勢: ヨーロッパは、Mistralおよび他のいくつかのイニシアチブを通じて、AIリーダーシップの第3の柱を確立しています。Mistralのモデルは、大規模な3 MoEから新しいDevstralコーディングシリーズに至るまで、海外のクローズドモデルに対するヨーロッパの回答として明確に位置付けられています[12]。EUのアプローチは、オープン性と信頼性に大きく依存しています。欧州の政策立案者は、オープンAI研究を支持し、それを技術的主権を確保する方法と見ています(つまり、EU企業が完全に米国のAPIや中国の技術に依存しないようにする)。Mistralが資本を調達し(ASMLなどの欧州の産業リーダーからの支援を受けて)、高性能なオープンモデルを提供するという成功は、シリコンバレー外で世界クラスのAIが構築できることの証明です。また、透明性を重視するEUの規制を補完しています。オープンモデルは、監査や現地の規範への適応を容易にします。Devstral 2により、ヨーロッパはアメリカ(Claude、GPTベースのコーダー)や中国(DeepSeek、Kimi)の最高のものに対抗できる旗艦コードモデルを持つようになりました。それは、協力とオープンイノベーションが生のパフォーマンスと並んで評価される、AI進歩への多国間アプローチを体現しています。
このAIにおける多極化の傾向は、グローバルな開発者や企業に利益をもたらす可能性があります。競争が各プレイヤーを革新へと駆り立てているのです。OpenAIはGPT-5をさらに強力にするために競争し、Anthropicは膨大なコンテキストと安全性に焦点を当て、中国のラボは新しい技術を用いてモデルを開発し続けています(Baiduの効率的なMoEビジョンモデルで見られるように)、そしてMistralは最先端のオープンステートを推進しながら、広範なアクセスを可能にし続けます。例えば、Mistralのオープンリリース後、Baiduが競争的な動きとして許可されたApacheライセンスを採用するのを目にしました。また、逆にMistralは、中国で開発された先進的な技術(例:長いコンテキストウィンドウ、他のモデルにおけるMoEルーティング)を統合しています。
多極化するAIの世界では、開発者はより多くの選択肢を持つことができます。プライバシー重視のオープンソースのヨーロッパのモデル、コスト効率を重視した中国のモデル、または能力を重視したアメリカのAPIを選ぶことができ、組み合わせることも可能です。これにより、特定の企業や国がAI技術を支配することが減少します。Mistralのチームが言うように、ミッションはAIが数社の大きなラボだけに支配されないようにすることです[42]。Devstral 2のリリースにより、そのビジョンは大きく前進します。AIの革新は、オープンソースソフトウェアのように、グローバルで協力的な取り組みになりつつあります。そして、「雰囲気」は明らかにオープンさと多様性を支持しています。
Mistral Devstral 2は、AIの重要な瞬間に登場します。それは、オープン性と協力が閉鎖的な既存勢力に対抗してその価値を証明している瞬間です。開発者にとっては、真に所有し、調整し、信頼できる強力な新しいコーディングアシスタントを意味します。組織にとっては、コストとデータに対するより大きなコントロールを持ちながら、トップレベルのAIコーディング能力を活用する道を提供します。そして業界全体にとって、Devstral 2は、AIの進歩がシリコンバレーの独占に限定されなくなったことを思い起こさせます。ヨーロッパのMistralは、そのオープンウェイトの理念とともに、「ヴァイブコーディング」の波に乗り、オープンモデルがプロダクションで何ができるかの限界を押し広げています[57][58]。AIがますます多極化する中で、真の勝者はこれらのモデルを使って構築する私たちです。Devstralやそれ以上のAIモデルやエージェントの豊富なツールキットを利用して、ソフトウェア開発とそれを超えて革新を加速させることができます。Devstral 2のリリースは、Mistralの地位を強化するだけでなく、グローバルな開発者コミュニティに最先端のコーディングAIを自分たちの条件で使用できる力を与えます。AIの次の章は、多くの手によって書かれるようで、Mistralは私たちに非常に有能なペンを渡しました。
出典: Mistral AI発表[1][2][23]; TechCrunchの報道[57][4][38]; ベンチマーク数値とモデル比較[20][6][18][19]; AnthropicとDeepSeekのリファレンス[59][48]; VentureBeatのBaiduに関するレポート[50][51]; TechCrunchのMistralインタビュー[40][42].
[1] [2] [5] [6] [7] [15] [16] [17] [20] [22] [23] [25] [26] [29] [31] [33] [35] [45] [46] [47] ご紹介します: Devstral 2 と Mistral Vibe CLI。| Mistral AI
https://mistral.ai/news/devstral-2-vibe-cli
[3] [4] [13] [14] [27] [28] [30] [38] [57] [58] Mistral AIが新しいコーディングモデルでバイブコーディングの追い風に乗る | TechCrunch
https://techcrunch.com/2025/12/09/mistral-ai-surfs-vibe-coding-tailwinds-with-new-coding-models/
[8] [9] [10] Devstral 2 - Mistral AI | Mistral Docs
https://docs.mistral.ai/models/devstral-2-25-12
[11] [54] [55] [59] deepseek-ai/DeepSeek-Coder-V2-Instruct · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Instruct
[12] [36] [39] [40] [41] [42] [43] [44] ミストラルが新たなオープンウェイトフロンティアと小型モデルで大手AIライバルに迫る | TechCrunch
[18] HumanEval:機械がコードを学んだ時 - Runloop
https://runloop.ai/blog/humaneval-when-machines-learned-to-code
[19] Code Llama:コードのためのオープンファウンデーションモデル - alphaXiv
https://www.alphaxiv.org/overview/2308.12950v3
[21] [56] 中国のムーンショットAIが兆のパラメータモデルKimi K2を発表
https://www.hpcwire.com/2025/07/16/chinas-moonshot-ai-releases-trillion-parameter-model-kimi-k2/
[24] Claude Sonnet 4.5の紹介 - Anthropic
https://www.anthropic.com/news/claude-sonnet-4-5
[32] [34] [37] Mistral、バイブコーディングクライアント「Mistral Code」をリリース | TechCrunch
https://techcrunch.com/2025/06/04/mistral-releases-a-vibe-coding-client-mistral-code/
[48] Claude 4.5の新機能
https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-5
[49] [50] [51] [52] BaiduがGPT-5を超えると主張するオープンソースのマルチモーダルAIを発表 | VentureBeat
[53] [2401.14196] DeepSeek-Coder: 大規模言語モデルが...