Armazenamento e Gestão de Dados com Data Lake e Data Lakehouse
Transforme dados em insights com Data Lakes e Data Lakehouses.
Online
Imediato
86 h/a
Prazo de Acesso
24 meses
12x no cartão
Descrição do Curso
Em um mundo dominado por dados, a capacidade de coletar, armazenar, processar e analisar grandes volumes de informação tornou-se um diferencial competitivo fundamental para empresas de todos os tamanhos.
Este curso surge como uma resposta a esta demanda, conduzindo os alunos por uma jornada imersiva através dos fundamentos e práticas avançadas de Data Lakes e Data Lakehouses.
Através de uma abordagem que alia teoria e prática na medida certa, os alunos vão desenvolver habilidades desde os conceitos essenciais até implementações específicas em ambientes locais e na nuvem, utilizando ferramentas líderes de mercado como AWS e Databricks.
O curso enfatiza a importância de conceitos como linhagem, observabilidade, qualidade, enriquecimento, catálogo e governança de dados, fornecendo aos alunos as habilidades necessárias para garantir que as informações sejam não apenas armazenadas, mas também otimizadas, seguras e prontas para análise.
Além disso, a crescente convergência entre Data Lakes e Data Warehouses é abordada de forma detalhada, permitindo aos alunos compreender e implementar soluções de Data Lakehouse, que combinam o melhor dos dois mundos para obter eficiência, escalabilidade e flexibilidade.
Logbook das Principais Atividades Práticas
- Lab 1 - Plano de Custo Para Implementar Data Lakes e Data Lakehouses em Diferentes Cenários
- Lab 2 - Design e Implementação de Data Lake Local Para Armazenamento e Processamento Distribuído
- Lab 3 - Design e Implementação de Data Lake na Nuvem com IaC e Terraform
- Lab 4 - Linhagem, Observabilidade, Qualidade, Enriquecimento e Governança de Dados no Data Lake
- Lab 5 - Trabalhando com Databricks Para Construção de Catálogo Unificado de Dados
- Lab 6 - Operações CRUD e Time Travel com Delta Lake
- Lab 7 - Delta Live Tables SQL Pipeline e Integração de Dados Batch e Streaming
- Projeto de Implementação de Data Lakehouse com Databricks e Delta Lake