Dieses Repository bietet zwei zuverlässige Lösungen zum Extrahieren von Daten aus Yandex Search Engine Results Pages (SERPs):
- Kostenloser Yandex Scraper: Ein Basistool zum Scraping von Yandex-Suchergebnissen im kleinen Maßstab
- Yandex SERP API in Enterprise-Qualität: Eine skalierbare, produktionsreife Lösung für die Echtzeit-Datenextraktion in hoher Stückzahl (Teil von Bright Data's SERP Scraper API)
- Free Yandex SERP Scraper
- Yandex SERP Scraper API
- Implementation Methods
- Yandex Search Query Parameters
- Practical Example
- Support & Resources
Der kostenlose Scraper bietet eine unkomplizierte Möglichkeit, Yandex-SERP-Daten im kleinen Maßstab zu sammeln. Er ist ideal für Entwickler, die begrenzte Datenmengen für persönliche Projekte, Forschung oder Testzwecke benötigen.
- Python 3.9+
- Erforderliche Pakete:
playwrightfür Browser-AutomatisierungBeautifulSoupfür HTML-Parsing
pip install playwright beautifulsoup4
playwright installNeu im Web-Scraping? Entdecken Sie unseren Beginner's Guide to Web Scraping with Python
- Öffnen Sie yandex-search-results-scraper.py
- Passen Sie die Variablen für Suchbegriffe und Seitenanzahl an:
PAGES_PER_TERM = {
"ergonomic office chair": 2,
}- Führen Sie das Skript aus
Eine der größten Herausforderungen beim Scraping von Yandex ist der aggressive CAPTCHA-Schutz:
Yandex nutzt ein strenges und sich ständig weiterentwickelndes Anti-Bot-System, um automatisierte Datenextraktion zu verhindern. Häufige CAPTCHA-Auslösungen können schnell zu IP-Blocks führen, wodurch es schwierig wird, stabile, langfristig laufende Scraper zu betreiben.
Während der kostenlose Scraper grundlegende Aufgaben abdeckt, hat er mehrere wichtige Einschränkungen:
- Hohes Risiko von IP-Blocking
- Begrenztes Anfragevolumen
- Ständige CAPTCHA-Unterbrechungen
- Nicht geeignet für Produktionsumgebungen
Für eine skalierbare und stabile Lösung ziehen Sie Bright Data’s dedizierte API in Betracht, die unten beschrieben ist. 👇
Die Yandex Search API ist Teil der Bright Data SERP Scraping API-Suite. Sie nutzt unsere branchenführende Proxy-Infrastruktur, um Yandex-Suchergebnisse in Echtzeit mit einem einzigen API-Call bereitzustellen.
- Globale Genauigkeit: Erhalten Sie maßgeschneiderte Ergebnisse für spezifische Standorte weltweit
- Pay-Per-Success: Sie zahlen nur für erfolgreiche Anfragen
- Echtzeitdaten: Greifen Sie in Sekunden auf aktuelle Suchergebnisse zu
- Unbegrenzte Skalierbarkeit: Bewältigen Sie Scraping in hoher Stückzahl mühelos
- Kosteneffizient: Macht den Bedarf an kostspieliger Infrastruktur überflüssig
- Zuverlässige Performance: Integrierte Anti-Blocking-Technologie
- 24/7 Experten-Support: Zugriff auf technische Unterstützung, wann immer Sie sie benötigen
📌 Vor dem Kauf testen: Testen Sie es kostenlos in unserer SERP API Live Demo
- Erstellen Sie ein Bright Data-Konto (neue Nutzer erhalten ein $5-Guthaben)
- Generieren Sie Ihren API key
- Folgen Sie unserer Schritt-für-Schritt-Anleitung, um die SERP API zu konfigurieren
Die einfachste Möglichkeit, die API zu verwenden, ist eine direkte Anfrage an den API-Endpunkt von Bright Data.
cURL Example:
curl https://api.brightdata.com/request \
-H "Content-Type: application/json" \
-H "Authorization: Bearer API_TOKEN" \
-d '{
"zone": "ZONE_NAME",
"url": "https://www.yandex.com/search/?text=apple+watch+series+10+review&lr=95&lang=en",
"format": "raw"
}'Python Example:
import requests
import json
url = "https://api.brightdata.com/request"
headers = {"Content-Type": "application/json", "Authorization": "Bearer API_TOKEN"}
payload = {
"zone": "ZONE_NAME",
"url": "https://www.yandex.com/search/?text=apple+watch+series+10+review&lr=95&lang=en",
"format": "raw",
}
response = requests.post(url, headers=headers, json=payload)
with open("yandex-scraper-api-result.html", "w", encoding="utf-8") as file:
file.write(response.text)
print("Response saved!")Diese alternative Methode nutzt Proxy-Routing für den direkten Zugriff auf Suchergebnisse.
cURL Example:
curl -i \
--proxy brd.superproxy.io:33335 \
--proxy-user brd-customer-<CUSTOMER_ID>-zone-<ZONE_NAME>:<ZONE_PASSWORD> \
-k \
"https://www.yandex.com/search/?text=apple+watch+series+10+review&lr=95&lang=en"Python Example:
import requests
import urllib3
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
host = "brd.superproxy.io"
port = 33335
username = "brd-customer-<customer_id>-zone-<zone_name>"
password = "<zone_password>"
proxy_url = f"http://{username}:{password}@{host}:{port}"
proxies = {"http": proxy_url, "https": proxy_url}
url = "https://www.yandex.com/search/?text=apple+watch+series+10+review&lr=95&lang=en"
response = requests.get(url, proxies=proxies, verify=False)
with open("yandex-scraper-api-result.html", "w", encoding="utf-8") as file:
file.write(response.text)
print("Response saved!")Note: Bei Verwendung des nativen Proxy-Ansatzes wird empfohlen, das SSL-Zertifikat von Bright Data für den Produktionseinsatz zu installieren. Erfahren Sie mehr im SSL Certificate Guide.
👉 Sehen Sie sich die vollständige HTML-Ausgabe an
Die Query-Parameter wie lr und lang werden im nächsten Abschnitt erklärt.
Dieser Parameter legt fest, welche geografische Region oder welches Land für die Suchergebnisse anvisiert wird.
| Region | Code |
|---|---|
| Moscow | 1 |
| Saint-Petersburg | 2 |
| USA | 84 |
| Canada | 95 |
| China | 134 |
Beispiel – Prüfen Sie, wie „best wireless earbuds“ in den USA rankt:
curl --proxy brd.superproxy.io:33335 \
--proxy-user brd-customer-<id>-zone-<zone>:<password> \
"https://www.yandex.com/search/?text=best+wireless+earbuds&lr=84"Legt die Sprachpräferenz anhand zweibuchstabiger Sprachcodes fest:
lang=en- Englischlang=es- Spanischlang=fr- Französisch
Beispiel – Sportnachrichten auf Spanisch abrufen:
https://www.yandex.com/search/?text=local+sports+news&lang=esSteuert, welche Ergebnisseite angezeigt wird:
p=0- Erste Seite (Standard)p=1- Zweite Seitep=4- Fünfte Seite
Jede Yandex-SERP-Seite liefert typischerweise 10 Ergebnisse.
Beispiel – Scrapen Sie Seite 3 (Ergebnisse 21–30) für „nike running shoes“:
https://www.yandex.com/search/?text=nike+running+shoes&p=2Begrenzt Ergebnisse auf einen bestimmten Zeitraum:
within=77- Ergebnisse aus den letzten 24 Stundenwithin=1- Ergebnisse aus den letzten 2 Wochenwithin=[%pm]- Ergebnisse aus dem letzten Monat
Beispiel – Ergebnisse zu „iPhone 15 review“ aus den letzten 24 Stunden:
https://www.yandex.com/search/?text=iphone+15+review&within=77Gibt an, welcher Gerätetyp simuliert werden soll:
brd_mobile=0oder weggelassen - Zufälliger Desktop-User-Agentbrd_mobile=1- Zufälliger Mobile-User-Agentbrd_mobile=iosoderbrd_mobile=iphone- iPhone-User-Agentbrd_mobile=ipadoderbrd_mobile=ios_tablet- iPad-User-Agentbrd_mobile=android- Android-Phone-User-Agentbrd_mobile=android_tablet- Android-Tablet-User-Agent
Beispiel – Simulieren Sie ein iPhone bei der Suche nach responsive website testing:
https://www.yandex.com/search/?text=responsive+website+testing&brd_mobile=iosDefiniert, welcher Browser simuliert werden soll:
- Default (weggelassen) - Zufälliger Browser
brd_browser=chrome- Google Chromebrd_browser=safari- Safaribrd_browser=firefox- Mozilla Firefox
Beispiel – Simulieren Sie den Safari-Browser bei der Suche nach Python-Tutorials:
https://www.yandex.com/search/?text=how+to+learn+python&brd_browser=safariNote: Kombinieren Sie
brd_browser=firefoxnicht mitbrd_mobile=1, da sie inkompatibel sind.
Für umfassendes Targeting können Sie mehrere Parameter kombinieren:
https://www.yandex.com/search/?text=organic+skincare+products
&lr=95
&lang=en
&p=2
&within=1
&brd_mobile=ios
&brd_browser=safariDiese Suche:
- Zielt auf Nutzer in Kanada ab (
lr=95) - Zeigt englische Ergebnisse an (
lang=en) - Zeigt die zweite Seite an (
p=2) - Begrenzt auf die letzten 2 Wochen (
within=1) - Simuliert einen iPhone-Nutzer (
brd_mobile=ios) - Verwendet den Safari-Browser (
brd_browser=safari)
Perfekt für ein Hautpflegeunternehmen, das aktuelle Trends zu Bio-Produkten im kanadischen Markt untersucht – so, wie sie von iOS-Mobilnutzern gesehen werden.
- Dokumentation: SERP API Documentation
- Verwandte APIs:
- Anwendungsfälle:
- Weiterführende Lektüre: Best SERP APIs
- Support kontaktieren: support@brightdata.com




