Armazenamento e Gestão de Dados com Data Lake e Data Lakehouse

Transforme dados em insights com Data Lakes e Data Lakehouses.

Formato

Online

Data de Início

Imediato

Carga Horária

86 h/a

Prazo de Acesso

24 meses

Parcelado

12x no cartão

Pré-requisitos
Recomendamos ter concluído o Curso de IaC com Terraform aqui na DSA.

Descrição do Curso

Em um mundo dominado por dados, a capacidade de coletar, armazenar, processar e analisar grandes volumes de informação tornou-se um diferencial competitivo fundamental para empresas de todos os tamanhos.

Este curso surge como uma resposta a esta demanda, conduzindo os alunos por uma jornada imersiva através dos fundamentos e práticas avançadas de Data Lakes e Data Lakehouses.

Através de uma abordagem que alia teoria e prática na medida certa, os alunos vão desenvolver habilidades desde os conceitos essenciais até implementações específicas em ambientes locais e na nuvem, utilizando ferramentas líderes de mercado como AWS e Databricks.

O curso enfatiza a importância de conceitos como linhagem, observabilidade, qualidade, enriquecimento, catálogo e governança de dados, fornecendo aos alunos as habilidades necessárias para garantir que as informações sejam não apenas armazenadas, mas também otimizadas, seguras e prontas para análise.

Além disso, a crescente convergência entre Data Lakes e Data Warehouses é abordada de forma detalhada, permitindo aos alunos compreender e implementar soluções de Data Lakehouse, que combinam o melhor dos dois mundos para obter eficiência, escalabilidade e flexibilidade.

Logbook das Principais Atividades Práticas

  • Lab 1 - Plano de Custo Para Implementar Data Lakes e Data Lakehouses em Diferentes Cenários
  • Lab 2 - Design e Implementação de Data Lake Local Para Armazenamento e Processamento Distribuído
  • Lab 3 - Design e Implementação de Data Lake na Nuvem com IaC e Terraform
  • Lab 4 - Linhagem, Observabilidade, Qualidade, Enriquecimento e Governança de Dados no Data Lake
  • Lab 5 - Trabalhando com Databricks Para Construção de Catálogo Unificado de Dados
  • Lab 6 - Operações CRUD e Time Travel com Delta Lake
  • Lab 7 - Delta Live Tables SQL Pipeline e Integração de Dados Batch e Streaming
  • Projeto de Implementação de Data Lakehouse com Databricks e Delta Lake

Ementa do Curso

Pronto(a) para Começar sua jornada como Engenheiro de Dados?