Login
O evento já encerrou...
Cloudera Data Scientist Training
Carregando recomendações...
Evento encerrado
Parcele sua compra em até 12x

Cloudera Data Scientist Training

3 ago - 2021 • 09:00 > 6 ago - 2021 • 17:00

Evento Online via À Definir

Descrição

CLOUDERA DATA SCIENCE TRAINING

Treinamento On-line

Este workshop de quatro dias abrange fluxos de trabalho de data science e machine learning em escala usando Apache Spark 2 e outros componentes importantes do ecossistema Hadoop. O workshop enfatiza o uso de métodos de ciência dos dados e machine learning abordando os desafios de negócios do mundo real.

Usando cenários e conjuntos de dados de uma empresa de tecnologia fictícia, os estudantes descobrem insights para o embasamento de decisões críticas de negócios e desenvolver produtos de dados para transformá-lo. O material é apresentado através de uma sequência de breves palestras, demonstrações interativas, exercícios práticos e debates. As demonstrações e exercícios do Apache Spark são conduzidos em Python (com PySpark) e R (com sparklyr) usando o ambiente Cloudera Data Science Workbench (CDSW).

100% HANDS-ON - Obtenha experiência na prática!

    O workshop inclui breves palestras, demonstrações interativas, exercícios práticos e debates, abrangendo temas como:

    • Visão geral da ciência dos dados e do machine learning em escala.
    • Visão geral do ecossistema Hadoop.
    • Trabalhando com dados HDFS e tabelas Hive, utilizando Hue.
    • Introdução ao Cloudera Data Science Workbench.
    • Visão geral do Apache Spark 2
    • Leitura e inserção de dados.
    • Gestão de qualidade de dados.
    • Higienização e transformação de dados.
    • Sumarização e agrupamento de dados.
    • Combinação, divisão e remodelagem de dados.
    • Exploração de dados.
    • Configuração, monitoramento e solução de problemas de aplicações Spark
    • Visão geral de machine learning em Spark MLlib.
    • Extração, transformação e seleção de recursos.
    • Construção e avaliação de modelos de regressão.
    • Construção e avaliação de modelos de clusterização.
    • Criar e avaliar modelos de agrupamento
    • Modelos de validação cruzada e ajuste de hiperparâmetros
    • Construção de pipelines de machine learning.
    • Implementação de modelos de machine learning.
    O QUE ESPERAR


    Os participantes adquirem habilidades práticas e experiência prática com ferramentas de ciência da dados, incluindo:

    • Spark, Spark SQL e Spark MLlib
    • PySpark e sparklyr
    • Cloudera Data Science Workbench (CDSW)
    • Hue

    CARGA HORÁRIA

    4 dias de 8 horas cada, totalizando 32 horas de treinamento

    IDIOMA

    O curso será ministrado em português.

    PARA QUEM ESSE CURSO É INDICADO?

    O workshop é direcionado para cientistas de dados que atualmente usam Python ou R para trabalhar com conjuntos de dados menores em uma única máquina e para aqueles que precisam ampliar suas análises e modelos de machine learning para grandes conjuntos de dados em clusters distribuídos. Engenheiros de dados e desenvolvedores com conhecimento em ciência e machine learning podem se interessar por este treinamento.

    Para participar deste evento, o profissional necessita de um conhecimento básico de Python ou R e alguma experiência explorando e analisando dados e desenvolvendo modelos estatísticos ou de aprendizagem em máquina. Conhecimento em Hadoop ou Spark não é requerido.

    COMO POSSO EFETUAR O PAGAMENTO? 

    Pague no cartão de crédito, boleto bancário ou transferência bancária. Damos desconto especial para pagamentos por transferência bancária de 5%. Entre em contato conosco para maiores informações através do e-mail [email protected] Para empresas, aceitamos transferência bancária ou boleto com emissão de nota fiscal eletrônica. Também efetuamos descontos especiais para grupos.

    O aluno deverá estar ciente de que a realização do curso está sujeito a quorum, por se tratar de serviços prestados para um grupo mínimo de participantes.

    A confirmação da realização será feita 5 dias antes da data estabelecida.

    SOBRE A SEMANTIX

    Somos uma das empresas mais atuantes no segmento de Inteligência Artificial e Big Data da América Latina. Há 10 anos somos responsáveis por oferecer treinamentos, projetos, implementações estratégicas de clusters e de ambientes de desenvolvimento apropriados para a análise e processamento de dados em larga escala, orientando empresas de diversos segmentos da indústria a se tornarem Data Driven. Em 2013 nos tornamos Cloudera Training Partners, sendo reconhecidos e premiados pela Cloudera por diversas vezes. Com o objetivo de difundir o conhecimento e fornecer aos nossos clientes e parceiros a experiência necessária para se tornarem líderes na era digital estamos sempre nos aprimorando e atualizando nosso portfólio de cursos e treinamentos.

    Saiba mais acessando o nosso site: https://semantix.com.br/

    Conte conosco para aprender tudo o que você precisa sobre Big Data. Fique ligado em nossos eventos!

    Termos e políticas

    Evento online

    Saiba como participar deste evento:

    Antes de tudo,
    cadastre-se ou acesse sua conta com o mesmo email usado no pedido.
    Acesse a aba Ingressos no site ou no app Sympla disponível para iOS e Android
    Selecione o evento desejado e toque no botão acessar evento
    Pronto! O link de acesso também será enviado para você por email.

    Sobre o organizador

    Cloudera Data Scientist Training

    Semantix

    Fundada em 2010 no Brasil, e hoje presente em toda a América, a Semantix desenvolve soluções no modelo Data Driven, para as organizações que precisam estar um passo à frente utilizando o que existe de mais atual em tecnologia.

    Métodos de pagamento

    Parcele sua compra em até 12x

    Compre com total segurança

    Os dados sensíveis são criptografados e não serão salvos em nossos servidores.

    Precisando de ajuda?

    Acessa a nossa Central de Ajuda Sympla ou Fale com o produtor.