-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy path00_ce082-intro.Rmd
172 lines (130 loc) · 4.71 KB
/
00_ce082-intro.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
---
title: "CE082 - Seminários"
author: "Fernando Mayer"
date: "Agosto, 2016"
output:
revealjs::revealjs_presentation:
theme: black
transition: slide
slide_level: 1
center: true
self_contained: false
reveal_plugins: "notes"
reveal_options:
slideNumber: true
---
```{r setup, include=FALSE}
source("setup_knitr.R")
```
# Sobre
## Formação
- Oceanógrafo (UNIVALI, 2005)
- Modelos Lineares Generalizados (MLGs)
- Mestre em Ecologia (UFSC, 2011)
- Modelos Lineares generalizados para dados de contagem com
superdispersão e excesso de zeros
- Doutorado em Estatística e Experimentação Agronômica (ESALQ/USP,
2013-2018)
- Modelos estado-espaço não lineares para a dinâmica de biomassa de
estoques pesqueiros
- Inferência bayesiana
# Sobre
## Mercado de trabalho
- Grupo de Estudos Pesqueiros (GEP) (UNIVALI, 2005-2008): análise de
dados pesqueiros (atuns e afins) e relatórios para ICCAT
- Difusão do R, cursos
- MLGs
- "Manipulação" de bases de dados
- Ministério da Pesca e Aquicultura (MPA, 2010-2011): estatística
pesqueira marinha do Brasil (2008 a 2010)
- Métodos estatísticos para dados faltantes
- Interação com IBGE
- Relações políticas
# Sobre
## Atuação acadêmica
- Professor substituto ECZ/UFSC (2011-2013)
- Recursos pesqueiros, ecologia de populações, informática aplicada
- Professor efetivo IMEF/FURG (2014)
- Estatística básica
- Professor efetivo DEST/UFPR (2015-?)
# O que vamos fazer nessa disciplina?
> "Metafilosofia" da Estatística
- História da Estatística
- Evolução das principais técnicas
- A Profissão de Estatístico
- Fundamentos de metodologia científica e filosofia da ciência
- Seminários apresentados por profissionais de diversas áreas
# Quem veio aqui por causa do termo "data science"?
# Data Science? Estatística?
[The data science Venn diagram](http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram)
![](img/Data_Science_VD.png)
# Data Science? Estatística?
- Conhecimento de matemática e estatística: é o que você está fazendo
aqui
- Habilidade hacker:
- Saber programar
- Saber responder perguntas sozinho
- Saber usar ferramentas de busca
- Experiência substancial: depende da área dos dados, da interação com o
pesquisador, ou de buscar o conhecimento
# Estatística
> I keep saying that the sexy job in the next 10 years will be
> statisticians, and I’m not kidding.
>
> --- Hal Varian, economista chefe do Google
Lohr, S. *For Today’s Graduate, Just One Word: Statistics*. [New York
Times](http://www.nytimes.com/2009/08/06/technology/06stats.html?_r=0),
6 ago 2009.
# O detetive estatístico
## Fumar causa câncer?
Método científico (testar uma hipótese):
- Conduzir um experimento controlado
- A variável de interesse deve ser a única coisa que varia entre um
grupo *experimental* e um grupo de *controle*
- Se houver diferença acentuada entre os dois grupos, podemos
**inferir** que foi a variável de interesse que causou o resultado.
# O detetive estatístico
## Fumar causa câncer?
Não podemos fazer esse tipo de experimento com seres humanos!
Qual a alternativa?
# O detetive estatístico
## Fumar causa câncer?
Estudo observacional!?
- Selecionar um grupo que se formou no mesmo ano (com fumantes e não
fumantes)
- Analisar a saúde dos integrantes na festa de 20 anos de formatura
Qual o problema com esse tipo de estudo?
# O detetive estatístico
## Fumar causa câncer?
- Fumantes e não fumantes devem ter outros aspectos de vida diferentes
- Se os fumantes tiverem uma saúde ruim, não saberíamos se foi por causa
do fumo ou outros fatores
Mais problemas?
# O detetive estatístico
## Fumar causa câncer?
- Fumantes tem menor probabilidade de comparecer ao evento (devido a
problemas de saúde)
- Fumantes podem morrer antes do encontro (definitivamente não
comparecerão)
- Isso introduz um **viés** nos dados
# O detetive estatístico
A Estatística se aproxima muito de um trabalho de detetive.
- Os dados geram pistas e padrões, que *podem* levar a conclusões
significativas
- Os dados apresentam pistas desorganizadas (a cena do crime)
- A análise estatística é o trabalho de detetive:
- Processar os dados brutos
- Obter conclusões
# Qual o objetivo?
## (de estudar estatísica)
- Sintetizar enormes quantidades de dados
- Tomar decisões melhores
- Responder a questões {sociais, ambientais, ...}
importantes
- Reconhecer padrões
- Avaliar a efetividade de políticas, drogas, inovações, ...
# O detetive estatístico
> A análise estatística raramente revela "a verdade". Em geral,
> construímos um caso circunstancial baseado em dados imperfeitos.
>
> --- Charles Wheelan