A instalação do componente HBase opcional está limitada a clusters do Dataproc criados com a versão da imagem 1.5 ou 2.0.
Embora o Google Cloud ofereça muitos serviços que lhe permitem implementar o Apache HBase autogerido, o Bigtable é frequentemente a melhor opção, uma vez que oferece uma API aberta com o HBase e a portabilidade da carga de trabalho. As tabelas de base de dados HBase podem ser migradas para o Bigtable para gestão dos dados subjacentes, enquanto as aplicações que interagiram anteriormente com o HBase, como o Spark, podem permanecer no Dataproc e ligar-se de forma segura ao Bigtable. Neste guia, fornecemos os passos de alto nível para começar a usar o Bigtable e referências para migrar dados para o Bigtable a partir de implementações do Dataproc HBase.
Comece a usar o Bigtable
O Cloud Bigtable é uma plataforma NoSQL altamente escalável e com bom desempenho que oferece compatibilidade com o cliente da API Apache HBase e portabilidade para cargas de trabalho do HBase. O cliente é compatível com as versões 1.x e 2.x da API HBase e pode ser incluído na aplicação existente para ler e escrever no Bigtable. As aplicações HBase existentes podem adicionar a biblioteca de cliente HBase do Bigtable para ler e escrever dados armazenados no Bigtable.
Consulte O Bigtable e a API HBase para ver mais informações sobre a configuração da sua aplicação HBase com o Bigtable.
Crie um cluster do Bigtable
Pode começar a usar o Bigtable criando um cluster e tabelas para armazenar dados que foram armazenados anteriormente no HBase. Siga os passos na documentação do Bigtable para criar uma instância, um cluster e tabelas com o mesmo esquema que as tabelas HBase. Para a criação automática de tabelas a partir de DDLs de tabelas do HBase, consulte a ferramenta de tradução de esquemas.
Abra a instância do Bigtable na Google Cloud consola para ver a tabela e os gráficos de monitorização do lado do servidor, incluindo linhas por segundo, latência e débito, para gerir a tabela recentemente aprovisionada. Para mais informações, consulte o artigo Monitorização.
Migre dados do Dataproc para o Bigtable
Depois de criar as tabelas no Bigtable, pode importar e validar os seus dados seguindo as orientações em Migrar o HBase no Google Cloud para o Bigtable. Depois de migrar os dados, pode atualizar as aplicações para enviar leituras e escritas para o Bigtable.
O que se segue?
- Consulte os exemplos do Wordcount Spark para executar o Spark com o Bigtable.
- Reveja as opções de migração online com a replicação em direto do HBase para o Bigtable.
- Veja o vídeo Como a Box modernizou as bases de dados NoSQL para compreender outras vantagens.