OpenAIが、半導体大手Broadcom(ブロードコム)と組み、初の自社向けカスタムチップ「Jalapeño(ハラペーニョ)」を発表した。学習ではなく推論(inference)に特化した専用チップである。早期テストでは、現行の最先端品を大きく上回る電力あたり性能を示したという。なぜいまOpenAIが自前のチップを持つのか。NVIDIA依存からの脱却という文脈を含め、その狙いを噛み砕いて整理する。
推論に特化した初の自社チップ「Jalapeño」
報じられた要点は明快だ。OpenAIが、Broadcomと協業して設計・製造したカスタム推論チップ「Jalapeño」を発表した。同社にとって初の自社向けチップである。推論とは、学習済みのモデルが実際にユーザーの問いに答えを返す処理を指す。ChatGPTにメッセージを送るたびに走っているのが、この推論だ。学習が一度きりの「教育」だとすれば、推論はサービスが続く限り毎日発生し続ける「運用」にあたる。利用者が増えるほど推論の総量は膨らみ、それを支える計算コストと電力消費も雪だるま式に増えていく。
Jalapeñoは、この推論という一点に絞って設計された。OpenAIは特に、リアルタイムのコーディング向けモデルを動かす際の運用コストの低さを強調している。早期テストの段階では、現行の最先端品と比べて電力あたり性能(performance per watt)が大幅に優れるとされる。一方で、事前学習(pre-training)のように負荷の重い処理は、引き続きNVIDIA(エヌビディア)のハードウェアに頼る見通しだという。つまりJalapeñoは、NVIDIA製GPUを全面的に置き換えるものではなく、運用コストがかさむ推論の領域に的を絞った一手である。
なぜ「推論特化チップ」が重要なのか
ここで「推論特化チップ」がなぜ重要になるのかを押さえておきたい。現在、生成AIの計算基盤の多くはNVIDIA製GPUに依存している。GPUは学習にも推論にも使える汎用性の高い設計だが、その分だけ無駄も生じる。汎用品は「何でもできる」代わりに「特定の処理に最適化されていない」からだ。一方、推論という一つの用途に絞って回路を設計すれば、同じ処理をより少ない電力・より低いコストでこなせる可能性が高い。スマートフォンのカメラや動画再生に専用チップが載っているのと同じ発想である。OpenAIは、推論コストのわずかな削減でも収益に大きく効くと説明しており、推論の効率は事業の採算性そのものを左右する。
NVIDIA依存を減らす内製化戦略
もう一つの論点が「AIインフラの内製化(垂直統合)」だ。OpenAIのように世界規模でサービスを展開する企業は、計算資源の多くを外部から調達している。その中心がNVIDIAのGPUであり、需要の集中によって価格は高止まりし、供給も逼迫しやすい。特定企業への依存は、コストの主導権を握られるだけでなく、調達できる量そのものが他社の都合に左右されるリスクを伴う。Broadcomとの提携は2025年10月に正式発表されたが、当初からNVIDIA依存を減らす戦略だと取り沙汰されてきた。OpenAIは、チップの設計(アーキテクチャ)からカーネル、メモリシステム、ネットワーク、スケジューリング、デプロイ、そして製品体験まで「スタック全体」を手がけ、各層をまとめて最適化する方針を掲げている。自社の用途を熟知したうえで、汎用品では手が届きにくい領域に専用設計で踏み込む、という考え方だ。
背景として、こうした「自社向けAIチップ」を持とうとする動きは、いまや巨大テック各社に共通する潮流である点も押さえておきたい。汎用GPUへの一極依存を避け、自社サービスに最適化した計算基盤を整える流れが強まっている。OpenAIとBroadcomによる今回の発表も、その大きな文脈の中に位置づけられる。推論コストの圧縮は、AIサービスの料金や提供できる機能の幅に直結するため、利用者である私たちにとっても無関係な話ではない。
AI競争の主戦場は、モデルの賢さだけでなく「それをいかに安く速く動かすか」というインフラ層へと広がりつつある。推論特化チップの内製化は、コストと電力という生成AI最大の弱点に正面から挑む一手だ。今回の発表が実際にどれほどの効率改善をもたらし、他社がどう追随するのか。AIサービスの価格や使い勝手にもいずれ跳ね返る話として、続報を注視したい。
参考:OpenAI unveils its first custom chip, built by Broadcom(TechCrunch、2026年6月24日)

