{"id":3595,"date":"2019-12-11T19:59:15","date_gmt":"2019-12-11T19:59:15","guid":{"rendered":"https:\/\/training.infnet.edu.br\/?post_type=lp_course&p=3595"},"modified":"2024-09-06T17:36:48","modified_gmt":"2024-09-06T17:36:48","slug":"data-science-big-data","status":"publish","type":"lp_course","link":"https:\/\/training.infnet.site\/cursos\/dados\/data-science-big-data\/","title":{"rendered":"Data Science & Big Data"},"content":{"rendered":"\t\t
In\u00edcio<\/a><\/span><\/span><\/p>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t A humanidade produz cada vez mais dados a partir do crescimento do uso de dispositivos m\u00f3veis, redes sociais, IoT (internet das coisas) e da digitaliza\u00e7\u00e3o de processos em geral. A demanda por profissionais que dominam o tratamento e an\u00e1lise desses dados usando as ferramentas corretas est\u00e1 em alta. \u00c9 uma oportunidade de carreira tanto para analistas quanto para gestores. Com esta forma\u00e7\u00e3o, voc\u00ea ser\u00e1 capaz de manipular, tratar e analisar dados das mais diversas fontes usando a linguagem R e se tornar um profissional altamente demandado pelas grandes organiza\u00e7\u00f5es.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t A forma\u00e7\u00e3o Data Science e Big Data<\/b> do Infnet Training possui 99 horas e pode ser conclu\u00edda em aproximadamente 3 meses com aulas no turno da noite ou uma aula aos s\u00e1bados de 9 horas. As aulas ser\u00e3o transmitidas ao vivo em uma sala de aula virtual com total interatividade entre o instrutor e a turma<\/b>. \u00c9 a mesma experi\u00eancia de uma sala de aula presencial.<\/p> Ao concluir a forma\u00e7\u00e3o, voc\u00ea se torna apto para atuar como Arquiteto de Dados (Data Architect<\/i>), Cientista de Dados (Data Scientist<\/i>), Analista de Dados (Data Analyst<\/i>) ou Analista de Business Intelligence (BI).<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t <\/p> Os alunos ter\u00e3o acesso a uma moderna plataforma de LMS (Le<\/i>arning Management System<\/i>) para compartilhamento de materiais entre docentes, alunos, tira d\u00favidas e, principalmente, <\/span>networking<\/i>, al\u00e9m de direito de acesso \u00e0 biblioteca digital do Instituto Infnet, com centenas de livros<\/b>.\u00a0<\/span><\/p> \u00a0<\/span>\u00a0<\/span><\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t Compet\u00eancias: Compet\u00eancias: Compet\u00eancias: Compet\u00eancias:<\/strong> Compet\u00eancias:<\/strong> Compet\u00eancias:<\/strong> Compet\u00eancias: Compet\u00eancias: Compet\u00eancias: Compet\u00eancias:<\/strong> Compet\u00eancias:<\/strong> Compet\u00eancias:<\/strong>PROPOSTA<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t
P\u00daBLICO-ALVO<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t
\n\t\t\t\t\t\t\t
PR\u00c9-REQUISITOS<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t
\n\t\t\t\t\t\t\t
COMO \u00c9 A FORMA\u00c7\u00c3O NO DIA A DIA<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t
CURSOS\/M\u00d3DULOS<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t
<\/strong>\u2192 Instalar o software Gephi
\u2192 Carregar uma base de lista de v\u00e9rtices
\u2192 Filtrar dados baseados em caracter\u00edsticas da rede
\u2192 Realizar an\u00e1lise sem\u00e2ntica de texto automatizada
\u2192 Criar uma visualiza\u00e7\u00e3o de nuvem de palavras
\u2192 Calcular tf-idf
\u2192 Agrupar not\u00edcias e textos em t\u00f3picos<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
<\/strong>\u2192 Explorar dados com a plataforma R Studio Cloud
\u2192 Instalar pacotes em R
\u2192 Calcular medidas estat\u00edsticas b\u00e1sicas
\u2192 Extrair o histograma dos dados
\u2192 Calcular a correla\u00e7\u00e3o dos dados<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
<\/strong>\u2192 Descrever a distribui\u00e7\u00e3o de um conjunto de dados atrav\u00e9s de medidas estat\u00edsticas
\u2192 Identificar outliers em um conjunto de dados
\u2192 Identificar dados faltantes em um conjunto de dados
\u2192 Realizar a entrada (input) de dados quando h\u00e1 dados faltantes
\u2192 Criar gr\u00e1ficos que ajudem na visualiza\u00e7\u00e3o de dados usando a ferramenta ggplot<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
\u2192 Produzir um relat\u00f3rio utilizando R Markdown
\u2192 Criar uma apresenta\u00e7\u00e3o utilizando R Markdown
\u2192 Publicar um relat\u00f3rio gerado em R Markdown em ambiente online
\u2192 Criar gr\u00e1ficos de segmenta\u00e7\u00e3o
\u2192 Segmentar uma base de clientes de uma loja online
\u2192 Segmentar uma base de dados georreferenciada<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
\u2192 Entender as fases de um projeto pelo m\u00e9todo CRISP-DM
\u2192 Acessar uma base de dados utilizando SQL
\u2192 Aplicar um modelo preditivo para uma base dados do mundo real usando R
\u2192 Utilizar a funcionalidade forecast para s\u00e9ries temporais
\u2192 Criar modelos de Machine Learning sem codifica\u00e7\u00e3o com Azure Machine Learning<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
\u2192 Identificar as principais caracter\u00edsticas e ferramentas de um ambiente baseado no ecossistema Hadoop.
\u2192 Descrever a arquitetura de um ambiente distribu\u00eddo baseado no ecossistema Hadoop.
\u2192 Diferenciar execution engines utilizados em ambientes distribu\u00eddos, tais como Map-reduce, TEZ ou Spark.
\u2192 Mover dados para uma estrutura HDFS.
\u2192 Consultar dados armazenados em uma estrutura HDFS utilizando o Apache Hive.<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t
<\/strong>\u2192 Instalar o software Gephi
\u2192 Carregar uma base de lista de v\u00e9rtices
\u2192 Filtrar dados baseados em caracter\u00edsticas da rede
\u2192 Realizar an\u00e1lise sem\u00e2ntica de texto automatizada
\u2192 Criar uma visualiza\u00e7\u00e3o de nuvem de palavras
\u2192 Calcular tf-idf
\u2192 Agrupar not\u00edcias e textos em t\u00f3picos<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
<\/strong>\u2192 Explorar dados com a plataforma R Studio Cloud
\u2192 Instalar pacotes em R
\u2192 Calcular medidas estat\u00edsticas b\u00e1sicas
\u2192 Extrair o histograma dos dados
\u2192 Calcular a correla\u00e7\u00e3o dos dados<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
<\/strong>\u2192 Descrever a distribui\u00e7\u00e3o de um conjunto de dados atrav\u00e9s de medidas estat\u00edsticas
\u2192 Identificar outliers em um conjunto de dados
\u2192 Identificar dados faltantes em um conjunto de dados
\u2192 Realizar a entrada (input) de dados quando h\u00e1 dados faltantes
\u2192 Criar gr\u00e1ficos que ajudem na visualiza\u00e7\u00e3o de dados usando a ferramenta ggplot<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
\u2192 Produzir um relat\u00f3rio utilizando R Markdown
\u2192 Criar uma apresenta\u00e7\u00e3o utilizando R Markdown
\u2192 Publicar um relat\u00f3rio gerado em R Markdown em ambiente online
\u2192 Criar gr\u00e1ficos de segmenta\u00e7\u00e3o
\u2192 Segmentar uma base de clientes de uma loja online
\u2192 Segmentar uma base de dados georreferenciada<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
\u2192 Administrar pelo menos um ambiente baseado em nuvem (AWS, Google, Azure ou IBM).
\u2192 Identificar as principais caracter\u00edsticas e ferramentas de um ambiente baseado no ecossistema Hadoop.
\u2192 Descrever a arquitetura de um ambiente distribu\u00eddo baseado no ecossistema Hadoop.
\u2192 Diferenciar execution engines utilizados em ambientes distribu\u00eddos, tais como Map-reduce, TEZ ou Spark.
\u2192 Mover dados para uma estrutura HDFS.
\u2192 Consultar dados armazenados em uma estrutura HDFS utilizando o Apache Hive.<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t
\u2192 Acessar uma base de dados utilizando SQL
\u2192 Instalar o pacote de tratamento de s\u00e9ries temporais
\u2192 Utilizar a funcionalidade Forecast do pacote de s\u00e9ries temporais
\u2192 Aplicar um modelo preditivo para uma base dados do mundo real<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t