Skip to content

Curso de curta duração: "Introdução à Programação e Ciência de Dados para a Gestão Pública" (SEADE-EGESP)

Notifications You must be signed in to change notification settings

seade-R/seade-intro-programacao

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

219 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Introdução à Programação e Ciência de Dados para a Gestão Pública

Bem vindas e bem vindos ao curso de Introdução à Programação e Ciência de Dados para a Gestão Pública do SEADE.

Este é o repositório de instruções, tutoriais e atividades do curso. O material foi preparado para a primeira versão do curso por Leonardo Barone. Pequenas revisões foram feitas por Thandara Santos e Lucas Mingardo.

Informações básicas

Instrutores

  • Primeira edição: Leonardo Barone
  • Segunda edição: Thandara Santos
  • Terceira edição: Lucas Mingardo

Apresentação

O curso oferece uma iniciação à lógica de programação e ao uso da linguagem R para organização, análise e apresentação de dados. O foco do curso é o desenvolvimento da habilidade de programação para solução de problemas diversos relacionados ao manejo de dados, com ênfase na preparação de dados para análise, na visualização de dados e na produção de estatísticas descritivas. R é uma linguagem de código aberto e desenvolvimento comunitário e se tornou uma das linguagens de programação e análise de dados mais populares em diversos campos científicos e profissionais.

Programa

Aula 01: Manipulação de dados no R e introdução - Na primeira aula do curso nos habituaremos à linguagem R trabalhando com uma das gramáticas mais populares de manipulação de dados em R, a do pacote dplyr. O curso começa, assim, não pelos elementos básicos da linguagem R, mas pelo seu uso mais comum. Dessa forma, nos habituaremos à linguagem observando seu uso a problemas concretos.

Aula 02: Do básico ao intermediário - Após termos aprendido sobre data frames, vamos fazer um percurso das funcionalidades básicas da linguagem até alguns de seus usos intermediários. O objetivo do percurso é criar um repertório de funções e utilidades da linguagem que serão utilizados adiante.

Aula 03: Tidyverse para manipulação de dados - No terceiro encontro, faremos o camninho de volta ao nosso ponto de partida do curso: a manipulação de dados com a gramática do dplyr. Exploraremos agora aspectos diversos da manipulação de dados com mais profundidade.

Aula 04: ggplot2: Gramática de gráficos - No quarto encontro, seguiremos com a produção de tabelas em R, agora explorando o pacote janitor. A seguir, e considerando que temos muitos recursos para manipular dados em R, veremos como produzir gráficos com a gramática de gráficos do pacote ggplot2.

Aula 05: Bases de dados relacionais - Neste último encontro veremos como utilizar a gramática do dplyr para trabalharmos com dados relacionais. Em seguida, você poderá explorar tutoriais opcionais sobre integração com SQL, Power BI e geração de relatórios automatizados com RMarkdown.

Desafios e Materiais de Apoio

Ao final de cada aula há um desafio prático para consolidar o aprendizado. Em caso de dificuldades, consulte os materiais de apoio disponíveis na pasta Material de Apoio, que além de conterem um exemplo de resposta comentada, fazem uma revisão do conteúdo da aula da semana anterior e apresentam um avanço da próxima aula. Os materiais de apoio funcionam como um acréscimo às recomendações de leitura sugeridas ao final de cada aula, oferecendo uma ponte prática entre os encontros e consolidando a sequência de aprendizado.

Dinâmica das Aulas

A partir da Aula 02, começaremos cada encontro acompanhando o material de apoio correspondente para retomarmos a discussão dos conceitos e revisarmos o conteúdo anterior. Além do exemplo de solução que apresentamos no material, esperamos discutir as diferentes abordagens e soluções desenvolvidas pelos participantes em seus desafios, promovendo o aprendizado colaborativo e o esclarecimento de dúvidas práticas.

Como este é um curso baseado na prática, nas demais aulas esperamos que os participantes assumam um papel ativo na leitura dos tutoriais e no desenvolvimento dos exercícios. Estaremos sempre disponíveis para esclarecer dúvidas, auxiliar com dificuldades específicas e orientar no desenvolvimento das atividades, mas o ritmo de aprendizado será conduzido pela autonomia de cada participante.

Ritmo de Aprendizado

É fundamental não se estressar e seguir o curso no seu próprio ritmo. O conteúdo foi estruturado em uma sequência pedagógica específica, onde cada tutorial constrói sobre o anterior, por isso é importante não pular etapas mesmo quando o progresso parecer lento. Se você está sentindo dificuldade em algum conceito, dedique o tempo necessário para assimilá-lo antes de avançar - é melhor dominar bem os fundamentos do que acelerar e ficar com lacunas de conhecimento. Lembre-se: cada pessoa tem seu tempo de aprendizado e isso é completamente normal.

Instalação do R e RStudio em sua máquina local

Trabalharemos, ao longo de todo o curso, com RStudio instalado no servidor do SEADE. Agora, para que você possa seguir usando R em sua vida, você vai precisar instalar a ferramenta na sua máquina local, seu desktop pessoal ou notebook.

O R e RStudio funcionam juntos, portanto, precisamos instalar os dois. Pense que o R é o motor e RStudio é a lataria do carro (a parte visível). Ambos são inteiramente gratuitos e já vêm com distribuições compiladas para Windows, Mac e Linux.

A instalação é bastante fácil e, em geral, basta seguir as instruções da tela.

  1. Para instalar o R, baixe a versão adequada para seu computador em: https://cloud.r-project.org/

  2. Para instalar o RStudio, baixe a versão adequada para seu computador em: https://www.rstudio.com/products/rstudio/download/

  3. Uma vez instalados o R e o RStudio, basta abrir o RStudio e começar a criar seus projetos. Lembre-se que os pacotes que usamos ao longo do curso vão precisar ser instalados em sua máquina. Esse processo vai acontecer uma única vez e, nas próximas vezes que for usar o R em sua máquina, basta carregas as bibliotecas.

Referências bibliográficas

  • Grolemund, Garrett (2014). Hands-On Programming with R. Ed: O'Reilly Media. Disponível gratuitamente aqui.
  • Wichkam, Hadley e Grolemund, Garrett (2016). R for Data Science. Ed: O'Reilly Media. Disponível gratuitamente aqui.
  • Damiani, Athos et al. (2022). Ciência de Dados em R. Disponível gratuitamente aqui.
  • Wichkam, Hadley (2016). ggplot2: Elegant Graphics for Data Analysis. Ed: O'Reilly Media. Disponível gratuitamente aqui.
  • Chang, Winston. R Graphics Cookbook. Ed: O'Reilly Media. Disponível gratuitamente aqui.
  • James, Gareth; Witten, Daniela; Hastie, Trevor; e Tibshirani, Rob (2021). An Introduction to Statistical Learning with Applications in R. 2 ed. Ed. Springer. Disponível gratuitamente aqui.

The Big Book of R é um livro sobre os muitos livros gratuitos em R que você encontra na internet sobre temas variados e vale muito a pena dar uma olhada.

The R Graph Library é uma coleção de gráficos feitos em R, sempre com o código reprodutível disponível. Ótima fonte para pensar como melhor criar visualizações de seus dados. A galeria tem um foco no tidyverse e ggplot2.

Caso, posteriormente, deseje avançar em seus estudos, recomendamos também:

  • Burns, Patrick (2011). The R Inferno. Ed: Lulu.com. Disponível gratuitamente aqui.
  • Wickham, Hadley (2019). Advanced R. Ed: Chapman and Hall/CRC. Disponível gratuitamente aqui.

About

Curso de curta duração: "Introdução à Programação e Ciência de Dados para a Gestão Pública" (SEADE-EGESP)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages