SQL-Zellen verwenden

In dieser Anleitung wird beschrieben, wie Sie SQL-Zellen verwenden, um Daten aus einem Colab Enterprise-Notebook abzufragen.

Übersicht

Eine SQL-Zelle ist eine Codezelle, in der Sie SQL-Abfragen in Ihrem Colab Enterprise-Notebook schreiben, bearbeiten und ausführen können. SQL-Zellen bieten einen alternativen Workflow zu IPython Magics für BigQuery.

Leistungsspektrum

SQL-Zellen bieten die folgenden Funktionen:

  • Unterstützung für Probeläufe: Validierung von SQL-Anweisung und Schätzung der Anzahl der von der Abfrage verarbeiteten Byte
  • Formatierung: Keyword-Linting und Syntaxhervorhebung
  • Benennung von BigQuery DataFrame-Ausgabevariablen: Auf die Ausgabevariable aus anderen Notebook-Zellen verweisen
  • Variablenersetzung: Verweisen Sie auf Python-Variablen und SQL-Zellen, um die Parametrisierung und die Möglichkeit zu unterstützen, die Ergebnisse einer vorherigen Abfrage abzufragen.
  • Betrachter für Ergebnismengen: Einfacher tabellarischer Betrachter für Ergebnismengen mit Paginierung für große Ergebnismengen

Unterstützter SQL-Dialekt und unterstützte Datenquelle

  • Colab Enterprise-SQL-Zellen unterstützen GoogleSQL.

  • Sie können SQL-Abfragen für BigQuery-Daten ausführen.

Beschränkungen

Beachten Sie beim Planen Ihres Projekts die folgenden Einschränkungen:

  • Sie können mehrere SQL-Anweisungen in einer einzelnen SQL-Zelle ausführen, aber nur die Ergebnisse der letzten SQL-Anweisung werden in einem DataFrame gespeichert.

Hinweise

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. Verify that billing is enabled for your Google Cloud project.

  3. Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  4. Erforderliche Rollen

    Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, damit Sie die Berechtigungen erhalten, die Sie zum Erstellen eines Colab Enterprise-Notebooks, zum Ausführen des Notebookcodes in einer Laufzeit und zum Verwenden von BigQuery-Daten im Notebook benötigen:

    Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

    SQL-Zelle erstellen

    So erstellen Sie eine SQL-Zelle in Colab Enterprise:

    1. Rufen Sie in der Google Cloud Console die Seite Meine Notebooks für Colab Enterprise auf.

      Zu „Meine Notebooks“

    2. Wählen Sie im Menü Region die Region aus, in der sich Ihr Notebook befindet.

    3. Klicken Sie auf das Notebook, das Sie öffnen möchten. Wenn Sie noch kein Notebook erstellt haben, erstellen Sie ein Notebook.

    4. Klicken Sie in der Symbolleiste auf das Menü  Optionen zum Einfügen von Codezellen und wählen Sie SQL-Zelle hinzufügen aus, um eine SQL-Zelle hinzuzufügen.

      Die SQL-Zelle wird Ihrem Notebook hinzugefügt.

    Abfrage eingeben und ausführen

    1. Geben Sie in die SQL-Zelle eine SQL-Abfrage ein. Einen Überblick über unterstützte Anweisungen und SQL-Dialekte finden Sie unter Einführung in SQL in BigQuery.

      Sie können in Ausdrücken auf Python-Variablen verweisen, indem Sie den Variablennamen in geschweifte Klammern ({ }) einschließen. Wenn Sie beispielsweise einen Wert in einer Python-Variablen mit dem Namen my_threshold angegeben haben, können Sie das Ergebnis mit einer Abfrage wie der folgenden einschränken:

      SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
          
    2. Bewegen Sie den Mauszeiger auf die SQL-Zelle, die Sie ausführen möchten, und klicken Sie dann auf die Schaltfläche  Zelle ausführen.

    Die Ausgabe der Abfrage wird automatisch als BigQuery-DataFrame mit demselben Namen wie der Titel der SQL-Zelle gespeichert.

    Mit dem Ergebnis interagieren

    Sie können mit der Ergebnismenge als BigQuery DataFrame oder pandas DataFrame interagieren.

    Sie können SQL-Anweisungen mit demselben SQL-Zellvariablennamen verketten. Sie können beispielsweise BigQuery DataFrames, die vom Ergebnis-Set generiert wurden, als Tabellen in einer nachfolgenden Abfrage verwenden, indem Sie den DataFrame-Namen in geschweifte Klammern ({ }) setzen. Im folgenden Beispiel wird auf die Ausgabe einer vorherigen Abfrage verwiesen, die als DataFrame mit dem Namen df gespeichert wurde:

    SELECT * FROM {df};

    Nächste Schritte