-
Notifications
You must be signed in to change notification settings - Fork 0
/
selected_cols.py
159 lines (152 loc) · 13.2 KB
/
selected_cols.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
def selected_cols(largeset = False, parties=True, pnroalue = True):
if largeset==True:
numeric_features = ['Miehet, 2018 (HE) osuudesta asukkaat',
'Naiset, 2018 (HE) osuudesta asukkaat',
'Asuntojen keskipinta-ala, 2018 (RA) osuus total',
'Talotyypit yhteensä 2019 Neliöhinta (EUR/m2) osuus total',
'Asumisväljyys, 2018 (TE) osuus total',
'Asukkaiden keski-ikä, 2018 (HE) osuus total',
'Postinumeroalueen pinta-ala osuus area_code',
'Perusasteen suorittaneet, 2018 (KO) osuudesta asukkaat',
'Ammatillisen tutkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Ylioppilastutkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Alemman korkeakoulututkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Ylemmän korkeakoulututkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Asukkaiden mediaanitulot, 2017 (HR) osuudesta asukkaat',
'Asukkaiden ostovoimakertymä, 2017 (HR) osuudesta asukkaat osuus total',
'Kesämökit yhteensä, 2018 (RA) osuudesta asukkaat',
'Pientaloasunnot, 2018 (RA) osuudesta asukkaat',
'Työlliset, 2017 (PT) osuudesta asukkaat',
'Työttömät, 2017 (PT) osuudesta asukkaat',
'Opiskelijat, 2017 (PT) osuudesta asukkaat',
'A Maatalous, metsätalous ja kalatalous, 2017 (TP) osuudesta asukkaat',
'B Kaivostoiminta ja louhinta, 2017 (TP) osuudesta asukkaat',
'C Teollisuus, 2017 (TP) osuudesta asukkaat',
'D Sähkö-, kaasu- ja lämpöhuolto, jäähdytysliiketoiminta, 2017 (TP) osuudesta asukkaat',
'E Vesihuolto, viemäri- ja jätevesihuolto ja muu ympäristön puhtaanapito, 2017 (TP) osuudesta asukkaat',
'F Rakentaminen, 2017 (TP) osuudesta asukkaat',
'G Tukku- ja vähittäiskauppa; moottoriajoneuvojen ja moottoripyörien korjaus, 2017 (TP) osuudesta asukkaat',
'H Kuljetus ja varastointi, 2017 (TP) osuudesta asukkaat',
'I Majoitus- ja ravitsemistoiminta, 2017 (TP) osuudesta asukkaat',
'J Informaatio ja viestintä, 2017 (TP) osuudesta asukkaat',
'K Rahoitus- ja vakuutustoiminta, 2017 (TP) osuudesta asukkaat',
'L Kiinteistöalan toiminta, 2017 (TP) osuudesta asukkaat',
'M Ammatillinen, tieteellinen ja tekninen toiminta, 2017 (TP) osuudesta asukkaat',
'N Hallinto- ja tukipalvelutoiminta, 2017 (TP) osuudesta asukkaat',
'O Julkinen hallinto ja maanpuolustus; pakollinen sosiaalivakuutus, 2017 (TP) osuudesta asukkaat',
'P Koulutus, 2017 (TP) osuudesta asukkaat',
'Q Terveys- ja sosiaalipalvelut, 2017 (TP) osuudesta asukkaat',
'R Taiteet, viihde ja virkistys, 2017 (TP) osuudesta asukkaat',
'S Muu palvelutoiminta, 2017 (TP) osuudesta asukkaat',
'T Kotitalouksien toiminta työnantajina; kotitalouksien eriyttämätön toiminta tavaroiden ja palveluiden tuottamiseksi omaan käyttöön, 2017 (TP) osuudesta asukkaat',
'U Kansainvälisten organisaatioiden ja toimielinten toiminta, 2017 (TP) osuudesta asukkaat',
'Ravintolat osuudesta asukkaat',
'Myymälät osuudesta asukkaat',
'Nuorten yksinasuvien taloudet, 2018 (TE) osuudesta taloudet',
'Lapsettomat nuorten parien taloudet, 2018 (TE) osuudesta taloudet',
'Lapsitaloudet, 2018 (TE) osuudesta taloudet',
'Teini-ikäisten lasten taloudet, 2018 (TE) osuudesta taloudet',
'Aikuisten taloudet, 2018 (TE) osuudesta taloudet',
'Eläkeläisten taloudet, 2018 (TE) osuudesta taloudet',
'Omistusasunnoissa asuvat taloudet, 2018 (TE) osuudesta taloudet',
'Vuokra-asunnoissa asuvat taloudet, 2018 (TE) osuudesta taloudet',
'Alimpaan tuloluokkaan kuuluvat taloudet, 2017 (TR) osuudesta taloudet',
'Keskimmäiseen tuloluokkaan kuuluvat taloudet, 2017 (TR) osuudesta taloudet',
'Ylimpään tuloluokkaan kuuluvat taloudet, 2017 (TR) osuudesta taloudet',
'1.1.3 Kirkollisvero Yhteensä Saajien lukumäärä osuudesta verotetut',
'11. Yrittäjätulot yhteensä Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.10 Muut veronalaiset sosiaalietuudet Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.6 Tapaturma- ym. muut päivärahat Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.7 Päivä- ja äitiyspäivärahat Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.8 Lapsen kotihoidon tuki Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.9 Kuntoutusraha ja -avustus Yhteensä Saajien lukumäärä osuudesta verotetut',
'5.1.3 Vuokratulo Yhteensä Saajien lukumäärä osuudesta verotetut',
'11.5.1.1 Asuntolainan korkomenot (TVL 58 § 2 mom.) Yhteensä Summa, euroa osuus total',
'14.12 Opintolainavähennys Yhteensä Summa, euroa osuus total',
'14.7 Kotitalousvähennys Yhteensä Summa, euroa osuus total',
'2. Tulot yhteensä Yhteensä Summa, euroa osuus total',
'1.1 Tuloverot yhteensä Yhteensä Summa, euroa osuus total',
'4.1.C Autoetu Yhteensä Summa, euroa osuus total',
'4.2 Työmatkakulujen perusteella palkkatulosta vähennettävä määrä (TVL 93 §) Yhteensä Summa, euroa osuus total',
'5. Pääomatulot yhteensä Yhteensä Summa, euroa osuus total',
'Ruotsinkielisten osuus väestöstä, %, 2019',
'Taajama-aste, %, 2018',
'Ulkomaan kansalaisten osuus väestöstä, %, 2019',
'Kuntien välinen muuttovoitto/-tappio, henkilöä, 2019 osuudesta asukkaat nollatta',
'etaisyys osuus area_code','tkalue',
'Tuloveroprosentti']
else:
numeric_features = ['Miehet, 2018 (HE) osuudesta asukkaat',
'Asuntojen keskipinta-ala, 2018 (RA) osuus total',
'Talotyypit yhteensä 2019 Neliöhinta (EUR/m2) osuus total',
'Asumisväljyys, 2018 (TE) osuus total',
'Asukkaiden keski-ikä, 2018 (HE) osuus total',
'Postinumeroalueen pinta-ala osuus area_code',
'Perusasteen suorittaneet, 2018 (KO) osuudesta asukkaat',
'Ammatillisen tutkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Ylioppilastutkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Alemman korkeakoulututkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Ylemmän korkeakoulututkinnon suorittaneet, 2018 (KO) osuudesta asukkaat',
'Asukkaiden ostovoimakertymä, 2017 (HR) osuudesta asukkaat osuus total',
'Kerrostaloasunnot, 2018 (RA) osuudesta asukkaat',
'Kesämökit yhteensä, 2018 (RA) osuudesta asukkaat',
'Pientaloasunnot, 2018 (RA) osuudesta asukkaat',
'Työlliset, 2017 (PT) osuudesta asukkaat',
'Työttömät, 2017 (PT) osuudesta asukkaat',
'Opiskelijat, 2017 (PT) osuudesta asukkaat',
'A Maatalous, metsätalous ja kalatalous, 2017 (TP) osuudesta asukkaat',
'J Informaatio ja viestintä, 2017 (TP) osuudesta asukkaat',
'K Rahoitus- ja vakuutustoiminta, 2017 (TP) osuudesta asukkaat',
'O Julkinen hallinto ja maanpuolustus; pakollinen sosiaalivakuutus, 2017 (TP) osuudesta asukkaat',
'P Koulutus, 2017 (TP) osuudesta asukkaat',
'Q Terveys- ja sosiaalipalvelut, 2017 (TP) osuudesta asukkaat',
'R Taiteet, viihde ja virkistys, 2017 (TP) osuudesta asukkaat',
'Ravintolat osuudesta asukkaat',
'Myymälät osuudesta asukkaat',
'Nuorten yksinasuvien taloudet, 2018 (TE) osuudesta taloudet',
'Lapsettomat nuorten parien taloudet, 2018 (TE) osuudesta taloudet',
'Lapsitaloudet, 2018 (TE) osuudesta taloudet',
'Aikuisten taloudet, 2018 (TE) osuudesta taloudet',
'Eläkeläisten taloudet, 2018 (TE) osuudesta taloudet',
'Omistusasunnoissa asuvat taloudet, 2018 (TE) osuudesta taloudet',
'Vuokra-asunnoissa asuvat taloudet, 2018 (TE) osuudesta taloudet',
'Alimpaan tuloluokkaan kuuluvat taloudet, 2017 (TR) osuudesta taloudet',
'Keskimmäiseen tuloluokkaan kuuluvat taloudet, 2017 (TR) osuudesta taloudet',
'Ylimpään tuloluokkaan kuuluvat taloudet, 2017 (TR) osuudesta taloudet',
'1.1.3 Kirkollisvero Yhteensä Saajien lukumäärä osuudesta verotetut',
'11. Yrittäjätulot yhteensä Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.6 Tapaturma- ym. muut päivärahat Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.7 Päivä- ja äitiyspäivärahat Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.8 Lapsen kotihoidon tuki Yhteensä Saajien lukumäärä osuudesta verotetut',
'4.2.9 Kuntoutusraha ja -avustus Yhteensä Saajien lukumäärä osuudesta verotetut',
'5.1.3 Vuokratulo Yhteensä Saajien lukumäärä osuudesta verotetut',
'11.5.1.1 Asuntolainan korkomenot (TVL 58 § 2 mom.) Yhteensä Summa, euroa osuus total',
'14.12 Opintolainavähennys Yhteensä Summa, euroa osuus total',
'14.7 Kotitalousvähennys Yhteensä Summa, euroa osuus total',
'1.1 Tuloverot yhteensä Yhteensä Summa, euroa osuus total',
'4.1.C Autoetu Yhteensä Summa, euroa osuus total',
'4.2 Työmatkakulujen perusteella palkkatulosta vähennettävä määrä (TVL 93 §) Yhteensä Summa, euroa osuus total',
'5. Pääomatulot yhteensä Yhteensä Summa, euroa osuus total',
'Ruotsinkielisten osuus väestöstä, %, 2019',
'Taajama-aste, %, 2018',
'Ulkomaan kansalaisten osuus väestöstä, %, 2019',
'Kuntien välinen muuttovoitto/-tappio, henkilöä, 2019 osuudesta asukkaat nollatta',
'etaisyys osuus area_code', 'tkalue',
'Tuloveroprosentti']
col_puolueet = ['Ääniosuus KD',
'Ääniosuus KESK',
'Ääniosuus KOK',
'Ääniosuus PS',
'Ääniosuus RKP',
'Ääniosuus SDP',
'Ääniosuus VAS',
'Ääniosuus VIHR',
'Äänestysosuus']
if not pnroalue:
not_in_kunta = ['Myymälät osuudesta asukkaat', 'Postinumeroalueen pinta-ala osuus area_code', 'Kuntien välinen muuttovoitto/-tappio, henkilöä, 2019 osuudesta asukkaat nollatta', 'etaisyys osuus area_code', 'tkalue', 'Ravintolat osuudesta asukkaat']
removeset = set(not_in_kunta)
numeric_features[:] = [x for x in numeric_features if x not in removeset]
categorical_features=[]
if parties:
numeric_features = numeric_features + col_puolueet
return(numeric_features, categorical_features)