Discover new courses and celebrate learning with us today. 🎓

Explore

Development

Web Development

Big Data - Processamento de dados com Spark e PySpark

4.9

315,475 rating
11 Lessons
229 Students
Last updated 2 months ago

By Felipe Mafra

via Udemy

Go To Course

About This Course

Crie o seu servidor Apache Spark, processe grandes quantidades e faça um streaming em tempo real utilizando PySpark :)

Não se assuste mais com as tecnologias de Big Data! Aprenda o essêncial para processar grandes quantidades de dados em memória com o melhor Framework do mercado: O Apache Spark!

Iniciaremos do zero, explicando o que é Big Data e o que é necessário para que um dado seja categorizado como tal. Tudo de forma simples, com uma linguagem leve e agradável!

Após nos situarmos entre as tecnologias explicadas, dentre elas, o Hadoop, criaremos um servidor Apache Spark em uma instalação Windows e então prosseguiremos o curso explicando todo o framework e analisando dados. Vale ressaltar que instalaremos o Spark no Windows para os usuários menos experientes. Caso você seja usuário Linux, não se preocupe: Os comandos são os mesmos!

Explicaremos detalhadamente o que são as variáveis de ambiente e como elas influenciam na instalação e configuração de programas, como por exemplo o Java e a sua máquina virtual, a JVM.

Aplicaremos Map Reduce e outras funções nativas do Spark, utilizaremos o Spark SQL, criaremos RDDs e os novos Dataframes! Tudo isso do zero, passo a passo, explicado com que você já conhece!

Preocupado com os softwares? Você terá um drive com todos os programas e scripts do curso, exlusivo para o nosso material, além de, é claro, também ter os links oficiais, caso deseje baixar os programs direto do fabricante!

E aí? Curtiu a ementa?

Vem comigo aprender a processar Big Data!!

Definir o que é Big Data
Definir o que é o Ecossistema Hadoop
Aplicar Map Reduce

Course Curriculum

Princípios de Big Data

9 Lectures

Introdução ao curso

O que é um cluster?

Introdução a Big Data

Aplicações de Big Data

A História do Hadoop

Infraestrutura - Crescimento Vertical e Horizontal

Funcionamento do HDFS

Hadoop Map Reduce

Entenda agora! Resumão do Capítulo

Infraestrutura - Montando um ambiente de Big Data

8 Lectures

Resumo do Ambiente

Instalando o VirtualBox

Instalando o Windows 10

Habilitando e configurando os adicionais de convidados

Entendendo as variáveis de ambiente

Executando o programa pelo Path

Instalação e configuração do JDK e do JRE

Instalando o Anaconda e verificando as variáveis de ambiente

Configuração do Apache Spark no Windows 10

3 Lectures

Descompactando e configurando o Spark

Configurando o Hive SQL

Executando o PySpark e entendendo o Spark Context

Princípios de Desenvolvimento em Spark

7 Lectures

Funções Lambda

List Comprehensions

Utilizando a função Map

Utilizando Map com boleanos

Função Filter

Princípios de RDD

Aplicando a função Reduce

Arquitetura Spark

1 Lectures

Spark x Hadoop Map Reduce

Utilizando o Apache Spark

2 Lectures

Introdução a RDDs e contexto

Operações com RDDs

Instructor

Felipe Mafra

4.9

315,475 Reviews
345 Students
34 Course

Nascido no Rio de Janeiro, segunda maior área metropolitana do Brasil, a terceira da América do Sul e 16ª do mundo. Possui mais de 19 anos de experiência em TI, apaixonado por tecnologia, instrutor por vocação, analista de Business Intelligence e Engenheiro de dados, certificado nas mais diversas plataformas nas áreas de Infraestrutura e Servidores, Banco de Dados, Business Intelligence,...

More Courses By Felipe Mafra

Virtualização com Oracle VirtualBox do zero!

4.9

(230)

O curso completo de Banco de Dados e SQL, sem mistérios!

4.9

(230)

Business Intelligence - SQL Server e Analysis Services

4.9

(230)

Business Intelligence SQL - ETL Integration Services

4.9

(230)

O que é Business Intelligence? Teoria sem mistérios!

4.9

(230)

Review

4.9 course rating

4K ratings

Brunno P. G.

2.0

11 months ago

Curso aparenta estar incompleto, pouca ou quase nenhuma aula sobre joins, agregações, funções de tratamento/conversão de dados no spark, etc

Helpful
Not helpful

Daniel A. P. D. V.

4.5

1 year ago

bom curso, informação útil e uma boa introdução. Apesar de não receber atualização há algum tempo ainda tem informação bem relevante e útil ainda nos dias de hoje. Vale a pena como ponta pé.

Helpful
Not helpful

Paulo C. T.

3.5

1 year ago

Faltou realizar uma imersão em processar os dados mesmo, como se fosse um case real, é um bom curso introdutório

Helpful
Not helpful

Anonymized U.

5.0

1 year ago

Gostei muito do final, com bons exemplos.

Helpful
Not helpful

João P. T. D. S.

5.0

1 year ago

Excelente, muito claro cada etapa do processo

Helpful
Not helpful

Ceilton M.

5.0

1 year ago

O curso é bom... Vai da instalação do ambiente ate o uso da linguagem python e pyspark... Poderia haver mais videos com o uso da linguagem

Helpful
Not helpful

Rodney C. R.

5.0

1 year ago

otimo curso

Helpful
Not helpful

Saulo S. C.

5.0

1 year ago

Explicações claras e objetivas acerca do funcionamento do Spark

Helpful
Not helpful

Anderson P.

5.0

2 years ago

Professor Mafra sempre com empenho e dedicação em passar o conhecimento de uma forma didática implacável. Espetacular o trabalho dele em todos os cursos.

Helpful
Not helpful

Nayara L.

2.5

2 years ago

Muita teoria (muito boa por sinal, por isso não achei TÃO péssimo), pouquíssima prática, só vemos de fato spark nas últimas aulas e olhe lá metade do curso foi só pra fazer as instalações da maquina virtual (não teria necessidade disso se tivesse um ambiente na nuvem) e outra metade sobre python, achei decepcionante mas pelo menos na teoria foi explicado muito bem.

Helpful
Not helpful

Ratings

This course includes:

54.5 hours on-demand video
3 articles
249 downloadable resources
Access on mobile and TV
Full lifetime access
Certificate of completion

Courses You May Like

Lorem ipsum dolor sit amet elit

Show More Courses

Become a Certified Web Developer: HTML, CSS and JavaScript

4.9

(230)

By: Carolyn Welborn

Big Data - Processamento de dados com Spark e PySpark

About This Course

Course Curriculum