-
Notifications
You must be signed in to change notification settings - Fork 0
/
questions
56 lines (43 loc) · 3.36 KB
/
questions
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
8. Execute uma sentença SQL que conte todos os registros da tabela DadosCovid. Para isso utilize a função count(*) do SQL. Anote o resultado.
hive> select count(*) from dadoscovid;
17705
Time taken: 30.904 seconds, Fetched: 1 row(s)
9. Execute uma sentença SQL que verifique quantas comunicações os países Uruguay e Brazil fizeram cada um durante o período de apuração do arquivo. Lembre-se, cada linha do arquivo é uma comunicação. Para isso, utilize a cláusula where. Anote o resultado.
hive> select descPais, count(*) from dadoscovid where descPais in ('Brazil', 'Uruguay') group by descPais;
Brazil 92
Uruguay 74
Time taken: 27.032 seconds, Fetched: 2 row(s)
10. Execute a seguinte sentença: select avg(novosCasos) from DadosCovid where descPais = “France”; Anote o resultado.
1141.632
11. Execute uma sentença que apure quantos novos casos e quantos novos óbitos foram comunicadas no dia 26/05/2020, considerando todos os países. Anote o resultado.
select sum(novoscasos) as sum_novoscasos,
sum(novosobitos) as sum_novosobitos
from dadoscovid
where dataocorrencia LIKE '2020-05-26%';
99023 1493
12. Execute o seguinte comando: describe extended DadosCovid. Copie o resultado apresentado em tela.
hive> describe extended dadoscovid;
OK
dataocorrencia string
siglapais string
descpais string
regiao string
novoscasos int
casosacumulados int
novosobitos int
obitosacumulados int
Detailed Table Information Table(tableName:dadoscovid, dbName:dbdesafio, owner:igti, createTime:1591927891, lastAccessTime:0, retention:0, sd:StorageDescriptor(cols:[FieldSchema(name:dataocorrencia, type:string, comment:null), FieldSchema(name:siglapais, type:string, comment:null), FieldSchema(name:descpais, type:string, comment:null), FieldSchema(name:regiao, type:string, comment:null), FieldSchema(name:novoscasos, type:int, comment:null), FieldSchema(name:casosacumulados, type:int, comment:null), FieldSchema(name:novosobitos, type:int, comment:null), FieldSchema(name:obitosacumulados, type:int, comment:null)], location:hdfs://localhost:54310/Desafio/dados_covid, inputFormat:org.apache.hadoop.mapred.TextInputFormat, outputFormat:org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat, compressed:false, numBuckets:-1, serdeInfo:SerDeInfo(name:null, serializationLib:org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, parameters:{serialization.format=,, line.delim=\n, field.delim=,}), bucketCols:[], sortCols:[], parameters:{}, skewedInfo:SkewedInfo(skewedColNames:[], skewedColValues:[], skewedColValueLocationMaps:{}), storedAsSubDirectories:false), partitionKeys:[], parameters:{totalSize=929317, numRows=0, rawDataSize=0, numFiles=1, transient_lastDdlTime=1591929379, bucketing_version=2}, viewOriginalText:null, viewExpandedText:null, tableType:MANAGED_TABLE, rewriteEnabled:false, catName:hive, ownerType:USER)
Time taken: 0.101 seconds, Fetched: 10 row(s)
13. Execute a sentença: select concat(dataOcorrencia, “ “, siglaPais, “ “, descPais) from DadosCovid where novosCasos = 501; Anote o resultado.
2020-03-11T00:00:00Z ES Spain
Time taken: 0.379 seconds, Fetched: 1 row(s)
14. Execute a sentença: select região, count(1) from DadosCovid group by regiao order by regiao; Anote os resultados.
OK
118
AFRO 3417
AMRO 4079
EMRO 1816
EURO 5431
SEARO 970
WPRO 1874
Time taken: 51.557 seconds, Fetched: 7 row(s)