Ein GitHub-Datensatzbeispiel mit über 2000 führenden Instagram Github Coding-Influencern. Der Datensatz wurde mit dem Bright Data Collector extrahiert.
- Anzahl der Follower
- Profiltyp
- Kontotyp
- Engagement-Score
- Kategorien
- Standort
- externe/Bio-Links
- verwendete Hashtags
- Markenaffiliation
- Bio
- Highlights
- Posts
Dies ist ein Beispiel-Subset, das aus dem Datensatz „All Instagram account, business & nonbusiness (public data)“ abgeleitet wurde; dieser Datensatz umfasst 614.000.000 Instagram-Profile.
In diesem Beispiel wurde der große Datensatz mithilfe intelligenter Filterabfragen, die im Bright Data Control Panel verfügbar sind, auf ein kleineres Subset heruntergefiltert.
-
$or: [{"post_hashtags":"github"},{"bio_hashtags":"github"}] -
followers: {"$gt":100}
Zusätzliche Filterabfragewerte umfassen: Anzahl der Posts, cuntry, verifiziertes Konto, mehrere Hashtag-Kombinationen und mehr.
Verfügbare Datensatz-Dateiformate: JSON, NDJSON, JSON Lines, CSV oder Parquet..
Optionen für den Datensatz-Bereitstellungstyp: API download, Amazon S3, Google cloud, Microsoft Azure, SFTP.
Datenanreicherung ist als Ergänzung zu den extrahierten Datenpunkten verfügbar: Durchschnittliche Post-Engagement-Rate, Markenaffiliation und mehr.
Holen Sie sich den vollständigen Instagram dataset.
- 635,000,000 „Instagram profiles dataset“
- 89,000,000 „Instagram posts dataset“
- 12,490,000 „Instagram reels dataset“
- 206,000 „Instagram comments dataset“
Die Bright Initiative bietet führenden akademischen Fakultäten und Forschenden sowie NGOs und NPOs, die verschiedene ökologische und soziale Anliegen fördern, Zugang zu den Web Scraper APIs von Bright Data. Sie können hier einen Antrag einreichen.