割り当てと上限

このドキュメントでは、Gemini for Google Cloudに適用される割り当てとシステム上限の一覧を示します。

  • 割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

Gemini リソースにはシステムの上限もあります。システムの上限は変更できません。

1 秒あたりのリクエスト数

Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 秒あたりのリクエスト数に対して割り当てを適用します。

割り当て
1 秒あたりのリクエスト数 2

1 日あたりのリクエスト数

Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 日あたりの合計リクエスト数に対して割り当てを適用します。

割り当て
コード生成やコード補完など、Gemini Code Assist または Gemini in BigQuery のコード リクエストの 1 日あたりのリクエスト数。 6000
Google Cloud コンソールと IDE の Cloud Assist パネルにレスポンスを表示するチャット、可視化、データ インサイト テーブルのスキャン、メタデータの生成、データ準備、その他のリクエストの 1 日あたりのリクエスト数。 960

Gemini Code Assist の割り当て

Gemini Code Assist は、特定の機能に対して割り当てを適用します。

割り当て
ローカル コードベースの認識 1,000,000 トークンのコンテキスト ウィンドウ
コードのカスタマイズ リポジトリ 20,000

エージェント モードと Gemini CLI の割り当て

Gemini Code Assist エージェント モードと Gemini CLI からのリクエストの割り当ては統合されます。エージェント モードの場合や Gemini CLI を使用している場合、1 つのプロンプトで複数のモデル リクエストが生成されることがあります。

割り当て Gemini Code Assist のエディション
ユーザーごとの 1 分あたりのリクエスト Standard 120
Enterprise 120
ユーザーごとの 1 日あたりのリクエスト数 Standard 1500
Enterprise 2000

GitHub の Gemini Code Assist の割り当て

GitHub の Gemini Code Assist の使用量は、Gemini Code Assist の一般的な割り当ての一部としてカウントされません。

  • GitHub の一般ユーザー向け Gemini Code Assist のユーザーには、1 日あたり 33 件の pull リクエスト レビューの割り当てがあります。

  • GitHub の Gemini Code Assist のエンタープライズ バージョン(プレビュー版)のユーザーには、1 日あたり 100 件以上の pull リクエスト レビューの割り当てがあります。

    • pull リクエストのレビューの正確な数は、コードベースと、各コードレビューを完了するために必要なモデル呼び出しの数によって異なります。そのため、割り当てが 100 を大幅に超える場合があります。

Gemini in BigQuery の割り当て

コード補完機能の場合、コード補完やコード生成などの機能に対する Gemini Code Assist と Gemini in BigQuery のコード リクエストの割り当ては同じです。

BigQuery オンデマンド コンピューティングを使用しているか、Enterprise エディションまたは Enterprise Plus エディションと組み合わせて Gemini in BigQuery を使用しているお客様の場合、データ インサイトなどの高度な機能の割り当ては、スキャンされた TiB の 1 日あたりの平均使用量、または直近の暦月のスロット時間に基づいて提供されます。この割り当ては組織レベルに適用され、その組織内のすべてのプロジェクトで使用できます。割り当ては、100 スロット時間単位で切り上げられます。

スロット時間 100 時間あたりの割り当て(Enterprise エディションまたは Enterprise Plus エディションの 1 日あたりの平均使用量)、またはオンデマンド コンピューティング モデルを使用してスキャンされた TiB あたりの割り当て
Google Cloud コンソールの Cloud Assist パネルにレスポンスを表示するチャット、可視化、テーブルのスキャン、その他のリクエストの 1 日あたりのリクエスト数。 5

: ベースラインとして 100 スロットの Enterprise エディションの予約がある組織では、1 日あたり平均 2,400 スロット時間(100 スロット × 24 時間 = 2,400 スロット時間)を使用します。その結果、翌月には 1 日の割り当てが次のようになります。

  • 1 日あたり 120 件のチャット、可視化、データ インサイトのテーブル スキャン、メタデータの自動生成

組織で BigQuery Enterprise エディション、Enterprise Plus エディションのスロット、またはオンデマンド コンピューティング(TiB)をこれまで購入したことがない場合は、初回使用後、最初の月に対して次のデフォルトの割り当てが付与されます。

  • 1 日あたり 250 件のチャット、可視化、データ インサイトのテーブル スキャン、メタデータの自動生成

オンデマンド コンピューティング、Enterprise エディション、または Enterprise Plus エディションの予約を月の半ばに開始した場合、翌月の末日までデフォルトの割り当てが適用されます。

割り当ての増加をリクエストする

通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。