Tutoriels

Les grands modèles de langage

Inférence JetStream MaxText sur v6e

Guide de configuration et d'utilisation de JetStream avec MaxText pour l'inférence sur v6e.
Inférence JetStream PyTorch sur v6e

Guide de configuration et d'utilisation de JetStream avec PyTorch pour l'inférence sur v6e.
Inférence vLLM sur v6e

Guide de configuration et d'utilisation de vLLM pour l'inférence sur v6e.
Mettre en service un LLM à l'aide de TPU sur GKE avec vLLM

Guide d'utilisation de vLLM pour mettre en service des grands modèles de langage (LLM) à l'aide de Tensor Processing Units (TPU) sur Google Kubernetes Engine (GKE).

Modèles de diffusion

Inférence MaxDiffusion sur v6e

Guide de configuration et d'utilisation de MaxDiffusion pour l'inférence sur v6e.

Classification d'images

Entraîner ResNet sur Cloud TPU (PyTorch)

Modèle de classification d'images ResNet utilisant PyTorch, optimisé pour fonctionner sur Cloud TPU.

Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.

Tutoriels Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Inférence JetStream MaxText sur v6e

Inférence JetStream PyTorch sur v6e

Inférence vLLM sur v6e

Mettre en service un LLM à l'aide de TPU sur GKE avec vLLM

Inférence MaxDiffusion sur v6e

Entraîner ResNet sur Cloud TPU (PyTorch)

Tutoriels