repare and readd cleverTech

peviitor-ro · Jul 4, 2023 · d25e171 · d25e171
1 parent cbf8d72
commit d25e171
Show file tree

Hide file tree

Showing 3 changed files with 51 additions and 44 deletions.
diff --git a/sites/A_OOI_main.py b/sites/A_OOI_main.py
@@ -16,8 +16,7 @@
            'proctergamble_scraper.py',
            'globallogic_scraper.py',
            'bittnet_scraper.py',
-           'kenvue_scraper.py',
-           'clevertech_scraper.py']
+           'kenvue_scraper.py']
 
 path = os.path.dirname(os.path.abspath(__file__))
 

diff --git a/sites/clevertech_scraper.py b/sites/clevertech_scraper.py
@@ -10,6 +10,7 @@
 from L_00_logo import update_logo
 #
 import requests
+from bs4 import BeautifulSoup
 #
 import uuid
 
@@ -19,10 +20,56 @@ def get_id() -> str:
     ... get id from site.
     '''
 
-    response = requests.head(url='https://clevertech.biz/jobs',
+    response = requests.get(url='https://clevertech.biz/jobs',
                             headers=DEFAULT_HEADERS)
+    soup = BeautifulSoup(response.text, 'lxml')
 
-    return response.headers
+    # search scr script
+    scr_script_id = str(soup.find_all("script", src=True)[-1]).split('/')[-3]
 
+    return scr_script_id
 
-print(get_id())
+
+def collect_data_from_clevertech() -> list[dict]:
+    '''
+    ... get data from clever tech with one request to json data.
+    Need more attention, because may be cause errros.
+    '''
+
+    idx = get_id()
+    response = requests.get(url=f'https://clevertech.biz/_next/data/{idx}/jobs/apply.json',
+                            headers=DEFAULT_HEADERS).json()
+
+    lst_with_data = []
+    for job in response['pageProps']['activeJobs']:
+        slug = job['slug']
+        title = job['name']
+
+        lst_with_data.append({
+                    "id": str(uuid.uuid4()),
+                    "job_title": title,
+                    "job_link":  f'https://clevertech.biz/remote-jobs/{slug}',
+                    "company": "clevertech",
+                    "country": "Romania",
+                    "city": "Remote"
+                })
+
+    return lst_with_data
+
+
+@update_peviitor_api
+def scrape_and_update_peviitor(company_name, data_list):
+    """
+    Update data on peviitor API!
+    """
+
+    return data_list
+
+
+company_name = 'clevertech'
+data_list = collect_data_from_clevertech()
+scrape_and_update_peviitor(company_name, data_list)
+
+print(update_logo('clevertech',
+                  "https://clevertech.biz/_next/static/media/ct-logo-greyred.cc64d432.svg"
+                  ))
diff --git a/sites/kenvue_scraper.py b/sites/kenvue_scraper.py