railbotan · ze-yter · Dec 11, 2021 · Dec 11, 2021 · Dec 11, 2021 · Dec 11, 2021
diff --git a/.idea/.gitignore b/.idea/.gitignore
diff --git a/.idea/inspectionProfiles/profiles_settings.xml b/.idea/inspectionProfiles/profiles_settings.xml
diff --git a/.idea/misc.xml b/.idea/misc.xml
diff --git a/.idea/modules.xml b/.idea/modules.xml
diff --git a/.idea/pandas_task.iml b/.idea/pandas_task.iml
diff --git a/.idea/vcs.xml b/.idea/vcs.xml
diff --git a/ANSWER.md b/ANSWER.md
@@ -0,0 +1,19 @@
+<h1>Задание №8</h1>
+
+1. Из 1068 людей не совпадают профессия и должность у 793.
+
+2. Топ образований людей, которые работают менеджерами:
+
+бакалавр 11 
+менеджер 10 
+специалист 6 
+экономист 6 
+экономист-менеджер 4
+
+3. Топ должностей людей, которые по диплому являются инженерами:
+
+заместитель директора 3 
+главный инженер 3 
+ведущий инженер-конструктор 2 
+инженер лесопользования 2 
+директор 2
diff --git a/task_1_2.py b/task_1_2.py
@@ -0,0 +1,7 @@
+import pandas as pd
+
+data = pd.read_csv('works.csv')
+
+print('Количество всех записей: ', data.shape[0])
+print('Количество мужчин: ', data[data['gender'] == 'Мужской'].shape[0])
+print('Количество женщин: ', (data['gender'] == 'Женский').values.sum())
diff --git a/task_3_4.py b/task_3_4.py
@@ -0,0 +1,11 @@
+import pandas as pd
+
+data = pd.read_csv('works.csv')
+
+print('Количество skills не NaN ', data.skills.notna().values.sum())
+print(data[data.skills.notna()]['skills'])
+
+salary = 20000
+group = 'Женский'
+
+print(data.query('salary == @salary and gender == @group'))
diff --git a/task_5.py b/task_5.py
@@ -0,0 +1,7 @@
+import pandas as pd
+
+data = pd.read_csv('works.csv')
+df = data.skills.dropna().str.lower().str.contains('python|питон')
+
+print('Зарплата людей, у которых в skills есть Python\n', data[data.skills.notna()][df]['salary'])
+
diff --git a/task_6.ipynb b/task_6.ipynb
diff --git a/task_7.ipynb b/task_7.ipynb
diff --git a/task_8.py b/task_8.py
@@ -0,0 +1,36 @@
+import pandas as pd
+
+
+def no_match_counter(firs_param, second_param, elements):
+    count = 0
+
+    for (f1, f2) in zip(elements[firs_param], elements[second_param]):
+        if not (contains(f1, f2) or contains(f2, f1)):
+            count += 1
+
+    return count
+
+
+def contains(first, second):
+
+    for word in first.lower().replace('-', ' ').split():
+        if word in second.lower():
+            return True
+
+    return False
+
+
+def get_job_list(size, df, searched_f, returned_f, search_s):
+    return df[df[searched_f].str.lower().str.contains(search_s[:-2])][returned_f].str.lower().value_counts().head(size)
+
+
+data = pd.read_csv("works.csv").dropna()
+count_not_matches_job = no_match_counter("jobTitle", "qualification", data)
+
+print(f"Из {data.shape[0]} людей не совпадают профессия и должность у {count_not_matches_job}")
+
+print("\nЛюди с таким образованием становятся менеджерами: ")
+print(get_job_list(5, data, "jobTitle", "qualification", "менеджер"))
+
+print("\nКем работают люди имеющие диплом инженера: ")
+print(get_job_list(5, data, "qualification", "jobTitle", "инженер"))