O que serei capaz de fazer após o curso?

Entender e executar o processo de ETL, planejar e executar a melhor forma de armazenamento e acesso; analisar e visualizar informações; conduzir experimentos de aprendizado de máquina. Produzir gráficos e resultados que melhor exprimam o conhecimento intrínseco existente nos dados. Tudo isso utilizando Python e os principais pacotes conhecidos (Numpy, Scikit-learn, Tensorflow, PyPlot, Pandas, etc).


A quem se destina o curso?

Essa formação é para você que já é engenheiros e cientistas da computação, analistas de sistemas e afins, assim como engenheiros de demais áreas, matemáticos, físicos, economistas ou administradores com conhecimentos básicos de programação, bancos de dados e estatística, e que desejem trabalhar como cientistas de dados.


Quais os objetivos do curso?

Esse curso tem como objetivo formar profissionais nas técnicas mais recomendadas para conduzir experimentos em ciência de dados e a base teórica necessária para analisar os resultados, estimular o pensamento crítico e propor novas soluções. Além disso, o curso traz as tecnologias mais modernas para abordar problemas de aprendizado de máquina, analytics e business intelligence.


O que vou aprender nesse curso?

Estatística e Análise de Dados:

  • Realizar análises exploratórias em conjuntos de dados;
  • Interpretar a distribuição de dados e conduzir testes de hipóteses;
  • Criar gráficos e visualizações de dados adequadas a cada situação.

 

Programação e Projetos:

  • Linguagem de programação Python;
  • Bibliotecas de Python voltadas a Ciência de Dados e Aprendizado de Máquina, como numpy, scipy, notebooks (jupyter e Kaggle), scikit-learn, Keras, nltk, gensim, spacy entre outros;
  • Como utilizar as ferramentas para tratar dados, como filtrar, reordenar, realizar buscas, limpar dados inválidos, entre outros;
  • Criação de scripts para treinar e testar modelos de aprendizado de máquina.

 

Big Data:

  • Como utilizar bancos de dados Não relacionais (NoSQL) baseados em documentos ou grafos;
  • Fundamentos e configuração do ecosistema Hadoop;
  • Como coletar dados abertos em websites e redes sociais como Facebook e Twitter.

 

Aprendizado de Máquina / Inteligência Artificial: 

  • Problemas práticos de aprendizado supervisionado (classificação e regressão) e não supervisionado (clusterização). Como conduzir experimentos de forma apropriada, interpretar os resultados, resolver problemas ou otimizar os modelos;
  • O aluno irá estudar os algoritmos mais tradicionais: Naive Bayes, Regressão Linear, Regressão Logística, K-Vizinhos, K-Means, Redes Neurais e SVM;
  • Técnicas de deep learning (aprendizado profundo): redes neurais profundas, backpropagation, descida do gradiente, redes recorrentes e redes LSTM, redes convolucionais, problemas de classificação e regressão. Problemas voltados a visão computacional e ao processamento de linguagem natural;
  • Técnicas voltadas ao processamento de linguagem natural e text mining que podem ser aplicadas a análise de sentimentos, extração de informação em texto não estruturado, sistemas de busca e recomendação de textos similares, desenvolvimento de chatbots, geração automática de texto, entre outros.

 

WhatsApp