Vad säger lagen om webbskrapning?

Permalänk
Medlem

Vad säger lagen om webbskrapning?

Har en idé om ett projekt jag vill göra, en stor del av projektet handlar om att samla information från vissa hemsidor och då är frågan, är detta lagligt?

Det är bara jag som kommer att ha åtkomst till den här informationen och den kommer att lagras i en lokal databas.

Jag är medveten om att många sidor brukar skriva i sina terms of service att man inte får skrapa deras sidor men jag undrar om detta stöds av lagen och om det händer mer än att man t.ex får sitt konto avstängt på sidan? Har inte läst sidornas t.o.s ännu men jag undrar mer generellt över lagar och så.

Permalänk
Medlem

@Taxi:

två problem kan uppstå

1# Personliga uppgifter som faller innom GDPR
2# Copyrights skyddat material.

normalt sett är (1) inget problem med (2) kan absolut vara det.
ett snabbt google bort visar på följande problem :

Existing Legal Issues With Web Scraping

Copyright Infringement: In most jurisdictions, web scraping is legal, but using copyright data contains certain restrictions.

Violation of the Computer Fraud and Abuse Act (CFAA): This law, enacted to prevent computer hackers, prevents fetching data by getting unauthorized access to a page.

Trespass to Chattel: Here, a chattel (or data) is violated if the website server is hurt in any way. Thus, trespass to chattel is violated if the server slows or stops because of the scraping.

tydligen är Resurs kostnader en faktor samt om du har accessat något bakom lösenord eller annan auth.
då Scrap:ern inte fått tillstånd utan bara "du personligen".

Permalänk
Medlem

@cg_thi: Tack för svar, nu har jag en tydligare bild av vad man får och inte får göra

Det förekommer en hel del bilder på sidorna som jag har för mig blir automatiskt copyright skyddade av den som skapat/tagit den? Men jag tänker att man förmodligen kommer runt det genom att enbart spara URL:en till bilden. Det där med att servern skulle belastas är ju förstås ett problem som man förmodligen inte kan undvika om man inte begränsar sina requests, det är ju även svårt att bedöma hur mycket man själv är med och påverkar.

Permalänk
Medlem

så länge du bara använder datan själv kan du göra vad du vill. Allting beror på syftet t.ex google skrapar hela internet. Sidor har oftast en robots.txt som talar om vad och hur skrapning får gå till.
https://support.google.com/webmasters/answer/6062608?hl=sv