Nvidia は、2023 年 11 月 13 日に H200 を発売しました。これは、現在の生成 AI 革命を推進する高度な人工知能モデルのトレーニングと展開に合わせて調整された最先端のグラフィックス プロセッシング ユニット (GPU) です。 新しい GPU は、OpenAI が最も複雑な言語モデルである GPT-4 をトレーニングするために使用する、前世代の H100 からのアップグレードです。 これらのチップの供給が限られているため、大企業、新興企業、政府機関の間で激しい競争が引き起こされています。 Raymond 氏によると、Nvidia H200 GPU.webp H100 チップの価格は 25,000 ドルから 40,000 ドルの間であり、最大のモデルのトレーニング (「トレーニング」と呼ばれるプロセス) を容易にするためには、これらのチップを多数組み合わせる必要があると考えられます。 NvidiaのAI GPUが市場に与えた影響により、同社の株価は急騰し、2023年現在までに230%以上上昇した。 Nvidia は、第 3 四半期の売上高が前年比 170% 増の約 160 億ドルになると予想しています。
H200 は、141 GB の最先端の「HBM3」メモリを統合することで大幅な進歩を遂げ、「推論」中のチップのパフォーマンスを向上させます。 推論には、トレーニングされたモデルをデプロイしてテキスト、画像、または予測を生成することが含まれます。 Nvidia は、H200 は前モデルの H100 に比べてほぼ 2 倍の速度で出力を生成できると主張しており、Meta の Llama 2 LLM を使用したテストでこれが証明されています。 H200 は 2024 年の第 2 四半期にリリースされ、AMD の MI300X GPU と競合します。MI300X GPU は同様の特性を持ち、対応するメモリ機能も強化されています。H200 の大きな利点は、H100 との互換性であり、現在 AI 企業が古いバージョンを使用できることです。モデルは、サーバー システムやソフトウェアを変更することなく、新しいバージョンをシームレスに統合します。 H200 は、Nvidia の HGX 完全システムを介して 4 つまたは 8 つの GPU サーバー構成に統合できます。また、H200 GPU と Arm ベースのプロセッサを組み合わせた GH200 と呼ばれるチップもあります。 ただし、Nvidia の最速 AI チップとしての H200 の優位性は続いていますが、Nvidia はさまざまなチップ構成を提供していますが、通常、メーカーが新しいアーキテクチャを採用すると、メモリの増加やその他の小さな最適化だけでなく、大幅なパフォーマンスの向上が実現します。 H100 と H200 はどちらも Nvidia の Hopper アーキテクチャに基づいています。 Nvidia は投資家に対し、GPU の需要が高いため、2 年ごとのアーキテクチャ ペースではなく 1 年ごとのリリース モデルに移行すると述べました。 同社は、BlackW ベースの Nvidia の 2024 年の発表と発売を示唆するスライドを共有しました。2023 年 11 月 13 日、Nvidia は、現在の生成用に特化した最先端のグラフィックス プロセッシング ユニット (GPU) を発売しました。 AI革命。 新しい GPU は、OpenAI が最も複雑な言語モデルである GPT-4 をトレーニングするために使用する、前世代の H100 からのアップグレードです。 レイモンド・ジェームスの試算によると、これらのチップの供給が限られているため、大企業、新興企業、政府の間で激しい競争が起きており、レイモンド・ジェームス氏の試算によると、Nvidia H200 GPU.webp H100チップの価格は2万5000ドルから4万ドルの間であり、これらのチップを大量に組み合わせる必要があるという。最大のモデルのトレーニング (「トレーニング」と呼ばれるプロセス) を促進します。 AI GPUの発売により同社の株価は急騰し、2023年現在までに230%以上上昇した。 NVIDIA は、第 3 四半期の売上高が前年比 170% 増の約 160 億ドルになると予想しています。H200 は、「推論」プロセス中のチップのパフォーマンスを向上させる 141GB の最先端の「HBM3」メモリを統合することにより、大きな進歩を遂げました。 推論には、トレーニングされたモデルを展開してテキストや画像を生成することが含まれます。 「推理」の過程でのパフォーマンス。 推論には、トレーニングされたモデルをデプロイして、「推論」のプロセスでテキスト、画像、パフォーマンスを生成することが含まれます。 推論には、トレーニングされたモデルを展開してテキストや画像を生成することが含まれます