--
DISCLAIMER: Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas. Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas aqui.
O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios... Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.
Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.
Dessa iniciativa também nasceu o Pizza de Dados, um podcast brasileiro focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.
No mais, é isso. Bem vinda(o), pequena(o) padawan :)
Algumas dicas sobre o que estudar para ser um cientista de dados hoje:
- Recomendações
- Vídeos
- Datasets
- Dicionário de termos em português
- Empresas no Brasil que trabalham com DS
- Grupos
- Metodologias Ágeis
- Dados em Imagens
- Tópicos específicos:
- Aprendizado de Máquina/Machine Learning
- Banco de dados
- Big Data
- Blogs e Jornais
- Carreira
- Cursos
- Deep Learning
- Geociências
- Inteligência Artificial
- Linguagens
- Livros
- Meetups e Eventos
- Notícias Legais
- Podcasts
- Processamento de Linguagem Natural
- Raspagem de Dados
- Reportagens relevantes
- Visualização de dados
- Python (lib Pandas) ou R
- SQL
- Jupyter Notebook
- Estatística Descritiva
- Machine Learning
- Cálculo
- Álgebra Linear
- Deep Learning
- Processamento de Linguagem Natural
- NoSQL
- Scala
- Spark
- Estatística Bayesiana
- Hive
- Hadoop
- Julia
- Computação distribuída com AWS e Google Cloud
- Numpy
- Pandas
- Scipy
- Matplotlib (Visualização)
- Seaborn (Visualização)
- Bokeh (Visualização)
- Scikit-learn
- NLTK
- PyTorch
- Ray
- h2o (Machine Learning)
- mlr(Machine Learning)
- xgboost(Machine Learning)
- dplyr(Manipulação de Dados)
- ggplot2 (Visualização)
- Lista de cursos online by KDnuggets
- Playlist de Treinamento by Edureka!
- Lista dos próximos by KDnuggets
- Curso de Python3 by Curso em Vídeo
- Aulas de Python by Ignorância Zero
- Datasets for Machine Learning
- Datasets for Data Mining and Data Science
- Datasets - Kaggle
- UCI Machine Learning Repository
- data.world
- Amazon Public Datasets
- brasil.io
- Microsoft Research Open Data
- Datasets for Recommender Systems
- Google Dataset Search
- Information is beautiful
- Dados do Governo Brasileiro
- Instituto de Pesquisa Econômica Aplicada
- Banco Central do Brasil
- Dados do Governo dos Estados Unidos
- Dados sobre as cidades dos EUA
- Dados do Governo do Canadá (em inglês e francês)
- Dados do Governo do Reino Unido
- Dados da União Europeia
- Dados do Censo dos EUA (dados da população americana e mundial)
- Banco de Dados da NASA
- Dados do Banco Mundial
- Dados sobre a saúde
- Dados públicos da Amazon
- Dados sobre diversos países (incluindo o Brasil)
- Dados sobre diversas áreas de negócio e finanças
- Google Trends
- Google Finance
- Gapminder
- Dados com milhões de músicas
- Dados sobre os mais diversos assuntos
- DBpedia
- Open Data Monitor
- Open Data Network
- R Datasets
- Stasci
- Portal de Estatística
- Data 360
- Reconhecimento de Faces
- Stanford Large Network Dataset Collection
- Datahub
- TeraData
- Oracle Exadata
- Data Science & Python - Telegram
- PyData BH - Telegram
- PyData BsB - Telegram
- Python Brasil Programadores - Facebook
- Machine & Deep Learning Brasil - Facebook
- Machine Learning & Data Science no Garoa - Telegram
- Dados Abertos - Telegram
- R Brasil Programadores - Facebook
- R Brasil - Telegram
- R-Ladies - Telegram
- Data Science Brasil - Facebook
- Data Science São Carlos (SP) Meetup
- IA Brasil - Telegram
- Open Data Science
- Big Data BR
- nlpbr(Processamento de Linguagem Natural)
- Python Brasil
- Estatística e Probabilidade
- CRISP-DM [pt-br]