Esta página explica como criar uma instância do Cloud Data Fusion.
Antes de começar
- Ative a API Cloud Data Fusion.
- É necessária a seguinte autorização para criar instâncias do Cloud Data Fusion:
instances.create
. Para mais informações, consulte o artigo Controlo de acesso. - As instâncias do Cloud Data Fusion são executadas como a conta de serviço predefinida do Compute Engine. Para obter informações sobre os tipos e as funções disponíveis, consulte o artigo Contas de serviço.
- Por predefinição, o Cloud Data Fusion executa pipelines através de um cluster do Dataproc no seu projeto. Certifique-se de que o seu projeto cumpre os requisitos de rede do Dataproc.
- Os novos projetos começam com uma rede predefinida. A rede predefinida é pré-preenchida com uma regra de firewall default-allow-ssh, que permite ligações recebidas na porta TCP 22 de qualquer origem para qualquer instância na rede. Nas versões anteriores à 6.2.0, se esta regra para permitir a entrada no TCP na porta 22 não existir na rede usada pela sua instância do Cloud Data Fusion, tem de criar esta regra.
Crie uma instância
Consola
Se a API estiver ativada, a secção Cloud Data Fusion na consola Google Cloud mostra uma página Instâncias, onde pode criar e gerir as suas instâncias do Cloud Data Fusion.
- Na consola, aceda à página do Cloud Data Fusion.
- Clique em Instâncias e, de seguida, em Criar uma instância.
- Introduza um Nome da instância.
- Introduza uma Descrição para a sua instância.
- Especifique a região na qual criar a instância.
- Especifique a versão do Cloud Data Fusion.
- Selecione uma edição. A predefinição é Básico.
- Opcional: clique em Adicionar aceleradores para selecionar os aceleradores a usar na sua instância.
- Especifique a conta de serviço do Dataproc a usar para executar o seu pipeline do Cloud Data Fusion no Dataproc. A predefinição é a conta do Compute Engine. Independentemente da versão, certifique-se de que uma conta de serviço tem funções de gestão de identidade e de acesso adequadas às suas necessidades. Para mais informações, consulte o artigo Conceder autorização do utilizador da conta de serviço.
Opcional: especifique quaisquer opções avançadas. Se não especificar nada, são usadas as seguintes predefinições:
Categoria Definição Descrição Predefinição IP privado Ative endereços IP internos Crie a instância do Cloud Data Fusion com um endereço IP interno. Desativado Monitorização e registo avançados Ative o Dataproc Cloud Logging
Ative o Cloud Monitoring do Dataproc
Ver registos avançados de pipelines no Cloud Logging. Desativado Integração da linhagem de dados do catálogo universal do Dataplex Ative ou desative a integração com a linhagem de dados do Dataplex Universal Catalog Veja a linhagem no catálogo universal do Dataplex. Desativado Encriptação Use uma chave de encriptação gerida pelo cliente (CMEK) Use o controlo de acesso baseado em funções nas versões 6.5 e posteriores. Desativado Marcadores Um par de chave-valor As etiquetas de recursos da instância a usar para anotar quaisquer recursos subjacentes relacionados, como VMs do Compute Engine. As chaves de etiquetas e os valores de etiquetas só podem conter letras, números, travessões e sublinhados. As chaves de etiquetas têm de começar com uma letra ou um número. Nenhum Manutenção Ative a janela de manutenção Defina o período durante o qual o Cloud Data Fusion pode realizar operações de manutenção na instância. Para mais informações, consulte o artigo Configure períodos de manutenção. Desativado Clique em Criar. O processo de criação da instância demora até 30 minutos a ser concluído.
Enquanto o Cloud Data Fusion cria a sua instância, é apresentado um indicador de progresso junto ao nome da instância na página Instâncias. Após a conclusão, transforma-se numa marca de verificação verde e indica que pode começar a usar a instância.
API
Crie uma instância:
Para criar uma instância do Cloud Data Fusion com a
API REST do Cloud Data Fusion,
crie um
instances.create
pedido da API, preenchendo o recurso
Instance
com as informações de configuração.
O que se segue?
- Saiba mais sobre o Cloud Data Fusion.
- Trabalhe num tutorial.