Fale com o organizador Semantix

O evento já encerrou...

Cloudera Data Scientist Training

Carregando recomendações...

Evento encerrado

Parcele sua compra em até 12x

Cloudera Data Scientist Training

3 ago - 2021 • 09:00 > 6 ago - 2021 • 17:00

Evento Online via À Definir

Descrição

CLOUDERA DATA SCIENCE TRAINING

Treinamento On-line

Este workshop de quatro dias abrange fluxos de trabalho de data science e machine learning em escala usando Apache Spark 2 e outros componentes importantes do ecossistema Hadoop. O workshop enfatiza o uso de métodos de ciência dos dados e machine learning abordando os desafios de negócios do mundo real.

Usando cenários e conjuntos de dados de uma empresa de tecnologia fictícia, os estudantes descobrem insights para o embasamento de decisões críticas de negócios e desenvolver produtos de dados para transformá-lo. O material é apresentado através de uma sequência de breves palestras, demonstrações interativas, exercícios práticos e debates. As demonstrações e exercícios do Apache Spark são conduzidos em Python (com PySpark) e R (com sparklyr) usando o ambiente Cloudera Data Science Workbench (CDSW).

100% HANDS-ON - Obtenha experiência na prática!

O workshop inclui breves palestras, demonstrações interativas, exercícios práticos e debates, abrangendo temas como:

Visão geral da ciência dos dados e do machine learning em escala.
Visão geral do ecossistema Hadoop.
Trabalhando com dados HDFS e tabelas Hive, utilizando Hue.
Introdução ao Cloudera Data Science Workbench.
Visão geral do Apache Spark 2
Leitura e inserção de dados.
Gestão de qualidade de dados.
Higienização e transformação de dados.
Sumarização e agrupamento de dados.
Combinação, divisão e remodelagem de dados.
Exploração de dados.
Configuração, monitoramento e solução de problemas de aplicações Spark
Visão geral de machine learning em Spark MLlib.
Extração, transformação e seleção de recursos.
Construção e avaliação de modelos de regressão.
Construção e avaliação de modelos de clusterização.
Criar e avaliar modelos de agrupamento
Modelos de validação cruzada e ajuste de hiperparâmetros
Construção de pipelines de machine learning.
Implementação de modelos de machine learning.

O QUE ESPERAR

Os participantes adquirem habilidades práticas e experiência prática com ferramentas de ciência da dados, incluindo:

Spark, Spark SQL e Spark MLlib
PySpark e sparklyr
Cloudera Data Science Workbench (CDSW)
Hue

CARGA HORÁRIA

4 dias de 8 horas cada, totalizando 32 horas de treinamento

IDIOMA

O curso será ministrado em português.

PARA QUEM ESSE CURSO É INDICADO?

O workshop é direcionado para cientistas de dados que atualmente usam Python ou R para trabalhar com conjuntos de dados menores em uma única máquina e para aqueles que precisam ampliar suas análises e modelos de machine learning para grandes conjuntos de dados em clusters distribuídos. Engenheiros de dados e desenvolvedores com conhecimento em ciência e machine learning podem se interessar por este treinamento.

Para participar deste evento, o profissional necessita de um conhecimento básico de Python ou R e alguma experiência explorando e analisando dados e desenvolvendo modelos estatísticos ou de aprendizagem em máquina. Conhecimento em Hadoop ou Spark não é requerido.

COMO POSSO EFETUAR O PAGAMENTO?
Pague no cartão de crédito, boleto bancário ou transferência bancária. Damos desconto especial para pagamentos por transferência bancária de 5%. Entre em contato conosco para maiores informações através do e-mail [email protected] Para empresas, aceitamos transferência bancária ou boleto com emissão de nota fiscal eletrônica. Também efetuamos descontos especiais para grupos.
O aluno deverá estar ciente de que a realização do curso está sujeito a quorum, por se tratar de serviços prestados para um grupo mínimo de participantes.
A confirmação da realização será feita 5 dias antes da data estabelecida.

SOBRE A SEMANTIX

Somos uma das empresas mais atuantes no segmento de Inteligência Artificial e Big Data da América Latina. Há 10 anos somos responsáveis por oferecer treinamentos, projetos, implementações estratégicas de clusters e de ambientes de desenvolvimento apropriados para a análise e processamento de dados em larga escala, orientando empresas de diversos segmentos da indústria a se tornarem Data Driven. Em 2013 nos tornamos Cloudera Training Partners, sendo reconhecidos e premiados pela Cloudera por diversas vezes. Com o objetivo de difundir o conhecimento e fornecer aos nossos clientes e parceiros a experiência necessária para se tornarem líderes na era digital estamos sempre nos aprimorando e atualizando nosso portfólio de cursos e treinamentos.

Saiba mais acessando o nosso site: https://semantix.com.br/

Conte conosco para aprender tudo o que você precisa sobre Big Data. Fique ligado em nossos eventos!

Termos e políticas

Evento online

Saiba como participar deste evento:

Antes de tudo,
cadastre-se ou acesse sua conta com o mesmo email usado no pedido.

Acesse a aba Ingressos no site ou no app Sympla disponível para iOS e Android

Selecione o evento desejado e toque no botão acessar evento

Pronto! O link de acesso também será enviado para você por email.

Saiba como acessar eventos online

Sobre o organizador

Semantix

Fundada em 2010 no Brasil, e hoje presente em toda a América, a Semantix desenvolve soluções no modelo Data Driven, para as organizações que precisam estar um passo à frente utilizando o que existe de mais atual em tecnologia.

Métodos de pagamento

Parcele sua compra em até 12x

Compre com total segurança

Os dados sensíveis são criptografados e não serão salvos em nossos servidores.

Precisando de ajuda?

Acessa a nossa Central de Ajuda Sympla ou Fale com o produtor.

Cloudera Data Scientist Training

Descrição

Evento online

Saiba como participar deste evento:

Sobre o organizador

Métodos de pagamento

Compre com total segurança

Precisando de ajuda?

Compre pelo APP

Encontre Eventos

Cidades

Categorias

Para Produtores

Planeje Seu Evento

Ajuda

Home

Sobre

Blog

Carreiras

Termos e Políticas

Ética e conduta

Política de Direitos Humanos da Prosus