Data verzamelen is geheel legitiem en kan gezien worden als een geavanceerde vorm van de “copy-paste” methode. Echter, wij zullen nooit een opdracht accepteren die ons zou verplichten ongeautoriseerde toegang te krijgen tot websites.
Sommige websites nemen maatregelen om geautomatiseerde dataverzameling te voorkomen door deze te blokkeren. Met behulp van proxyservers kunnen wij deze beperkingen omzeilen, waardoor het lijkt alsof verschillende IP-adressen de site bezoeken.
We zijn in staat om data van Amazon te verzamelen, ondanks hun anti-scraping tools. Ons cloudscraper pakket is specifiek ontworpen om Cloudflare’s beschermingsmechanismen te omzeilen. We hebben vastgesteld dat dit effectief is, vooral bij sites zoals Amazon.
Daarnaast beschikken we over methodes om Captcha’s te omzeilen. Als onze scraper een captcha tegenkomt, wordt de URL teruggeplaatst in de wachtrij en aangepast om herhaling te vermijden. We implementeren ook een korte pauze na elk paginaverzoek, wat in onze ervaring effectief is gebleken.