• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Web scraping a polskie prawo

Object Storage Arubacloud
0 głosów
1,140 wizyt
pytanie zadane 3 października 2022 w Offtop przez nielotweb Bywalec (2,240 p.)
Cześć!

Planuje stworzyć nowy projekt do portfolio i wpadłem na pomysł związany z web scrapingiem. Tylko, że związane byłoby to z pobieraniem danych z innych serwisów typu olx, otomoto czy otodom i tu pytanie:

Czy pobieranie takich danych, ogłoszeń z tych serwisów i umieszczenie tego w swoim projekcie i udostępnienie go publicznie jest złamaniem polskiego prawa? Czy to jest może zależne od serwisu i jego regulaminów? Nawet uwzględniając to, że nie zarabiałbym na tym ani złotówki. Zakładam, że jakbym na tym zarabiał to napewno jest to nielegalne - ale pytanie czy jako projekt osobisty mógłbym takie dane pobierać i umieszczać u siebie?

5 odpowiedzi

+3 głosów
odpowiedź 4 października 2022 przez marcin99b Szeryf (82,040 p.)
W regulaminach powinny być informacje o tym, że konkretny portal tego zakazuje

Jeśli nie zakazują, warto dodać informacje skąd pochodzą dane - najlepiej w postaci linków do źródeł, żeby dać jasną informacje że to nie są twoje autorskie treści

Myśle że nawet gdybyś na tym zarabiał, ale treści byłyby odpowiednio oznaczone i nie łamałyby regulaminów, to nikt by się nie przyczepił, jest sporo portali które zarabiają na tym, że robią treści oparte o cudze treści (przykładowo agregatory blogów/portali) - z jednej strony to jest "kradzież odbiorców", z drugiej strony odbiorca bezpośrednio widzi kto jest twórcą i jeśli spodoba mu się konkretny twórca, to może go obserwować bezpośrednio

Co więcej, są nawet twórcy którzy płacą żeby ich treści znalazły się w takich miejscach, bo to dla nich dodatkowa reklama
komentarz 4 października 2022 przez nielotweb Bywalec (2,240 p.)
O, to bardzo ciekawe! W sumie też szedłem tym tokiem myślenia ale wolałem się dowiedzieć od innych. Najlepiej będzie i tak jak sam posprawdzam regulaminy i napiszę do nich - być może mi konkretnie odpiszą. Dzięki za odpowiedź!
komentarz 8 kwietnia przez reaktywny Nałogowiec (40,970 p.)

@marcin99b, dokładnie tak jak piszesz.

Problem jest gdy wrzucasz u siebie cały artykuł lub zdjęcia, ale przecież są strony które publikują tylko część treści, cytują tylko z oryginału, itp.

+2 głosów
odpowiedź 3 października 2022 przez Ehlert Ekspert (212,670 p.)

Czy to jest może zależne od serwisu i jego regulaminów? 

Na pewno mają zaznaczone ze dane należą do nich, więc umieszczanie ich u siebie 1:1 jest prawnie śliskie. Z drugiej strony wątpię żebyś osiągnął taką skalę, aby wchodzili na drogę prawną.

1
komentarz 4 października 2022 przez nielotweb Bywalec (2,240 p.)
hmm rozumiem, dzięki za odpowiedź. W sumie spróbuje napisać do kilku z nich i zobaczę, może mi odpiszą
0 głosów
odpowiedź 4 października 2022 przez tmar1212 Bywalec (2,600 p.)
Wyszukaj też w internecie informacji o plikach robots.txt.
0 głosów
odpowiedź 8 kwietnia przez reaktywny Nałogowiec (40,970 p.)
Ja słyszałem, że scrapować można ile wlezie, bez ograniczeń, tylko z wykorzystaniem tych danych może być problem, bo artykułów czy zdjęć nie wolno wrzucać u siebie, są objęte prawami autorskimi. Ale do analiz czy wyciągnięcia jakichś wniosków - jak najbardziej.

Tu niektórzy piszą, że nie wolno scrapować, to jak działają wszelkie agregaty treści (których jest mnóstwo) ?!?!? Poza tym to w interesie każdego portalu jest, że ktoś inny go podlinkuje (dla pozycji w Google oczywiście).

Przykład:

https://www.adradar.pl/
komentarz 8 kwietnia przez niezalogowany
–1 głos
odpowiedź 8 kwietnia przez niezalogowany

Art 107 ustawy z 10 maja 2018 r. o ochronie danych osobowych : „kto przetwarza dane osobowe, choć ich przetwarzanie nie jest dopuszczalne albo do ich przetwarzania nie jest uprawniony, podlega grzywnie, karze ograniczenia wolności albo pozbawienia wolności do lat dwóch.” ( teraz już chyba trzech )

A tutaj co to są dane osobowe:
https://commission.europa.eu/law/law-topic/data-protection/reform/what-personal-data_pl

Proszę przygotować sobie 5 małych kartek i wylosować:

  1. wątpię że się ktoś zorientuję i wejdzie na drogę prawną ( ostatecznie będę rżnął głupa, że nic nie wiem )
  2. będę płacił 10 000 000 Euro kary do końca życia, jeśli będę naiwny
  3. pójdę siedzieć do pierdla na 3 lata, bo posłuchałem "specjalistów" na pasja-informatyki
  4. dostanę 3 lata w zawieszeniu i wpis do kartoteki na 10 lat, bo posłuchałem "specjalistów" na pasja-informatyki
  5. zapytam czy mogę właściciela danych ( pewnie się nie zgodzi, ale nie zaszkodzi )

Polecam rozeznać samemu. Nas tutaj nie słuchać. Nikt za pana ani nie pójdzie siedzieć, ani nie zapłaci kary. Życzę mądrych i dojrzałych decyzji niepopartych opiniami dzieci, ale świadomością konsekwencji na całe życie.

Scrapping jest bardzo śliski.

komentarz 8 kwietnia przez reaktywny Nałogowiec (40,970 p.)

"...kto przetwarza dane osobowe...."  - to jest zupełnie co innego :)

Podobne pytania

+1 głos
1 odpowiedź 266 wizyt
+1 głos
1 odpowiedź 158 wizyt
0 głosów
1 odpowiedź 419 wizyt
pytanie zadane 19 sierpnia 2022 w Python przez NewbieProgrammer Początkujący (480 p.)

92,551 zapytań

141,393 odpowiedzi

319,523 komentarzy

61,936 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...