O curso está dividido em 3 módulos, a saber:
Nivelamento: Neste módulo os alunos (que podem ser de quaisquer áreas do conhecimento, e que tenham conhecimentos básicos de programação), terão acesso a 4 disciplinas. A primeira delas, é de programação em Python. Nesta disciplina os alunos terão os conceitos básicos da linguagem e também um treinamento para utilização das ferramentas que serão usadas no curso (Jupyter Notebook). Na sequência, uma disciplina de R, onde terão conceitos de estatística, imprescindíveis no processo. Por fim, uma disciplina de metodologia da pesquisa (para entender os conceitos básicos de pesquisa) e também de empreendedorismo, caso queiram uma carreira como empreendedores.
Big Data e Data Science: Neste módulo os alunos terão conteúdos relacionados a Big Data e Data Science. O primeiro conteúdo tem por definição: O desafio de trabalhar com dados estruturados e não estruturados em grande escala. A escala, neste caso, refere-se ao volume de dados sendo gerados, a velocidade ou a taxa em que está sendo gerado. Para empacotar, processar e analisar Big Data, existem diversas ferramentas tais como Hadoop e Spark. No caso de Data Science, é um campo interdisciplinar onde diferentes métodos científicos, tecnologias e ferramentas estão disponíveis para obter informações sobre os dados. A natureza dos dados envolvidos pode ser estruturada e não estruturada. E as informações obtidas podem ser usadas para a tomada de decisões empresariais ou para fins de pesquisa.
Machine Learning: Neste módulo, os alunos terão conteúdos relacionados com Machine Learning ou aprendizado de máquina. Este é definido como um tipo de inteligência artificial que permite as aplicações de software tornarem-se mais precisas na previsão de resultados sem ser explicitamente programada. A sua premissa básica da aprendizagem é construir algoritmos que podem receber dados de entrada e usam análises estatísticas para prever um valor de saída dentro de um intervalo aceitável.