Comece Agora
Pipelines de ETL e Machine Learning com Apache Spark
Entrar no universo do Apache Spark é embarcar em uma jornada rumo ao coração das operações de dados mais avançadas de hoje. Este curso leva você a essa imersão, combinando teoria com uma abordagem prática centrada em sete projetos sensacionais.
Formato
Curso Online
Data de Início
Imediato
Carga Horária
84 h/a
Prazo de Acesso
24 meses
Investimento
O pagamento pode ser feito à vista ou em até 12x sem juros no cartão de crédito
Pré-Requisitos
Recomendamos ter concluído o Curso Gratuito Introdução à Ciência de Dados
Descrição do Curso
Este curso é uma jornada que irá abrir muitas portas no crescente campo da ciência e arquitetura de dados e aprendizado de máquina, proporcionando uma base sólida sobre a qual construir uma carreira promissora.
Confira o Logbook das principais atividades práticas do curso:
- Projeto 1 - Pipeline de Exploração de Dados e Operações SQL com Spark SQL
- Projeto 2 - Desenvolvimento de Pipeline de ETL Para Execução em Cluster Spark
- Projeto 3 - Pipeline de Coleta, Transformação e Análise de Dados em Tempo Real
- Projeto 4 - Pipeline Para Modelos de Linguagem (LLMs) com LangChain e Apache Spark
- Projeto 5 - Deploy e Versionamento de Modelos de Machine Learning com Spark e Databricks
- Projeto 6 - Otimização de Aplicação Spark em Python, Scala e R
- Projeto 7 - Low-Code Data Lakehouse com Apache Spark e Delta Lake
Ao final deste curso, você não apenas entenderá, mas também saberá como aplicar, de forma prática, as principais funcionalidades do Apache Spark no mundo real.
O que está esperando? Comece agora mesmo!