Comece Agora

PySpark e Apache Kafka Para Processamento de Dados em Batch e Streaming

Você deseja se tornar um profissional em alta demanda, desenvolver habilidades em duas das principais tecnologias no cenário atual da engenharia de dados (Spark e Kafka), trabalhar em laboratórios práticos no seu próprio computador e ainda compreender quando e como usar e processar dados em tempo real e em lote? Então este curso é para você!

Formato

Curso Online

Data de Início

Imediato

Carga Horária

90 h/a

Prazo de Acesso

24 meses

Investimento

O pagamento pode ser feito à vista ou em até 12x sem juros no cartão de crédito

Pré-Requisitos

Recomendamos ter concluído o Curso Gratuito de Linguagem Python aqui na DSA.


Descrição do Curso

Você deseja se tornar um profissional em alta demanda, desenvolver habilidades em duas das principais tecnologias no cenário atual da engenharia de dados (Spark e Kafka), trabalhar em laboratórios práticos no seu próprio computador e ainda compreender quando e como usar dados em tempo real e em lote?

Então este curso é para você!

Este curso oferece uma jornada incrível, desde a preparação do ambiente de trabalho com PySpark, passando por técnicas avançadas de ETL utilizando Python, até a integração e processamento de dados em tempo real com o Apache Kafka. Ao longo dos módulos, os alunos serão expostos a conceitos essenciais do PySpark para processamento distribuído de dados, assim como a práticas e técnicas avançadas para limpeza e processamento de dados usando PySpark com dados em lote e em tempo real.

Com a crescente demanda por processamento em tempo real e análises avançadas, as habilidades com PySpark e Kafka tornaram-se requisitos básicos para os Engenheiros de Dados modernos.

O Apache Kafka, particularmente, está revolucionando a maneira como as empresas lidam com dados em tempo real, permitindo a integração de diversas fontes de dados e garantindo entrega com baixa latência.

Da mesma forma, o PySpark, uma api do Apache Spark para Python, facilita o processamento distribuído, tornando possível analisar grandes volumes de dados de forma eficiente.

E o que acontece quando unimos as duas tecnologias? Uma plataforma completa de processamento de dados, open-source.

O curso está repleto de laboratórios práticos, como a criação de pipelines ETL, otimização de processamento em clusters Spark e simulações de erros em clusters Kafka, garantindo que os alunos não apenas entendam a teoria, mas também sejam capazes de aplicar o conhecimento adquirido em cenários do mundo real.



Este curso une teoria e prática na medida certa com atividades práticas que levam você para o dia a dia do Engenheiro de Dados.

Confira o Logbook das principais atividades práticas do curso:

  • Projeto 1 - Pipeline PySpark Para Extrair, Transformar e Carregar Arquivos JSON em Banco de Dados
  • Projeto 2 - 50 Scripts de Otimização de Processamento e Análise de Dados em Cluster Spark
  • Projeto 3 - Pipeline de Limpeza e Transformação Para Aplicações de IA com PySpark SQL
  • Projeto 4 - Processamento e Análise de Dados em Tempo Real com PySpark Streaming
  • Projeto 5 - Stack de Integração de Dados Entre Sistemas Homogêneos com Apache Kafka
  • Projeto 6 - Kafka Streams Para Agregação de Dados em Tempo Real
  • Projeto 7 - Stack de Extração, Transformação e Carga de Dados com Kafka, PySpark e Data Lakehouse
  • Projeto 8 - Simulação de Erros e Recuperação de Falhas em Cluster Kafka


Concluir este curso não apenas vai aprimorar seus conhecimentos em duas das ferramentas mais procuradas no campo da engenharia de dados, mas também lhe proporcionará uma vantagem competitiva no mercado.

Se você está buscando dominar as complexidades do processamento de dados, tanto em batch quanto em streaming, e deseja se destacar em um ambiente profissional cada vez mais orientado a dados, este curso é o ideal. Com uma combinação equilibrada de teoria e prática, você estará bem equipado para enfrentar os desafios do mundo real e conseguir as melhores vagas no mercado de trabalho.
Seja um profissional em alta demanda e comece este curso agora mesmo!

Pronto(a) para começar sua jornada como Engenheiro de Dados?