• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Web scraping a polskie prawo

Aruba Cloud VPS - 50% taniej przez 3 miesiące!
0 głosów
1,693 wizyt
pytanie zadane 3 października 2022 w Offtop przez nielotweb Bywalec (2,240 p.)
Cześć!

Planuje stworzyć nowy projekt do portfolio i wpadłem na pomysł związany z web scrapingiem. Tylko, że związane byłoby to z pobieraniem danych z innych serwisów typu olx, otomoto czy otodom i tu pytanie:

Czy pobieranie takich danych, ogłoszeń z tych serwisów i umieszczenie tego w swoim projekcie i udostępnienie go publicznie jest złamaniem polskiego prawa? Czy to jest może zależne od serwisu i jego regulaminów? Nawet uwzględniając to, że nie zarabiałbym na tym ani złotówki. Zakładam, że jakbym na tym zarabiał to napewno jest to nielegalne - ale pytanie czy jako projekt osobisty mógłbym takie dane pobierać i umieszczać u siebie?

5 odpowiedzi

+3 głosów
odpowiedź 4 października 2022 przez marcin99b Szeryf (83,530 p.)
W regulaminach powinny być informacje o tym, że konkretny portal tego zakazuje

Jeśli nie zakazują, warto dodać informacje skąd pochodzą dane - najlepiej w postaci linków do źródeł, żeby dać jasną informacje że to nie są twoje autorskie treści

Myśle że nawet gdybyś na tym zarabiał, ale treści byłyby odpowiednio oznaczone i nie łamałyby regulaminów, to nikt by się nie przyczepił, jest sporo portali które zarabiają na tym, że robią treści oparte o cudze treści (przykładowo agregatory blogów/portali) - z jednej strony to jest "kradzież odbiorców", z drugiej strony odbiorca bezpośrednio widzi kto jest twórcą i jeśli spodoba mu się konkretny twórca, to może go obserwować bezpośrednio

Co więcej, są nawet twórcy którzy płacą żeby ich treści znalazły się w takich miejscach, bo to dla nich dodatkowa reklama
komentarz 4 października 2022 przez nielotweb Bywalec (2,240 p.)
O, to bardzo ciekawe! W sumie też szedłem tym tokiem myślenia ale wolałem się dowiedzieć od innych. Najlepiej będzie i tak jak sam posprawdzam regulaminy i napiszę do nich - być może mi konkretnie odpiszą. Dzięki za odpowiedź!
komentarz 8 kwietnia przez reaktywny Nałogowiec (44,580 p.)

@marcin99b, dokładnie tak jak piszesz.

Problem jest gdy wrzucasz u siebie cały artykuł lub zdjęcia, ale przecież są strony które publikują tylko część treści, cytują tylko z oryginału, itp.

+2 głosów
odpowiedź 3 października 2022 przez Ehlert Ekspert (214,470 p.)

Czy to jest może zależne od serwisu i jego regulaminów? 

Na pewno mają zaznaczone ze dane należą do nich, więc umieszczanie ich u siebie 1:1 jest prawnie śliskie. Z drugiej strony wątpię żebyś osiągnął taką skalę, aby wchodzili na drogę prawną.

1
komentarz 4 października 2022 przez nielotweb Bywalec (2,240 p.)
hmm rozumiem, dzięki za odpowiedź. W sumie spróbuje napisać do kilku z nich i zobaczę, może mi odpiszą
0 głosów
odpowiedź 4 października 2022 przez tmar1212 Bywalec (2,600 p.)
Wyszukaj też w internecie informacji o plikach robots.txt.
0 głosów
odpowiedź 8 kwietnia przez reaktywny Nałogowiec (44,580 p.)
Ja słyszałem, że scrapować można ile wlezie, bez ograniczeń, tylko z wykorzystaniem tych danych może być problem, bo artykułów czy zdjęć nie wolno wrzucać u siebie, są objęte prawami autorskimi. Ale do analiz czy wyciągnięcia jakichś wniosków - jak najbardziej.

Tu niektórzy piszą, że nie wolno scrapować, to jak działają wszelkie agregaty treści (których jest mnóstwo) ?!?!? Poza tym to w interesie każdego portalu jest, że ktoś inny go podlinkuje (dla pozycji w Google oczywiście).

Przykład:

https://www.adradar.pl/
komentarz 8 kwietnia przez niezalogowany
–1 głos
odpowiedź 8 kwietnia przez niezalogowany

Art 107 ustawy z 10 maja 2018 r. o ochronie danych osobowych : „kto przetwarza dane osobowe, choć ich przetwarzanie nie jest dopuszczalne albo do ich przetwarzania nie jest uprawniony, podlega grzywnie, karze ograniczenia wolności albo pozbawienia wolności do lat dwóch.” ( teraz już chyba trzech )

A tutaj co to są dane osobowe:
https://commission.europa.eu/law/law-topic/data-protection/reform/what-personal-data_pl

Proszę przygotować sobie 5 małych kartek i wylosować:

  1. wątpię że się ktoś zorientuję i wejdzie na drogę prawną ( ostatecznie będę rżnął głupa, że nic nie wiem )
  2. będę płacił 10 000 000 Euro kary do końca życia, jeśli będę naiwny
  3. pójdę siedzieć do pierdla na 3 lata, bo posłuchałem "specjalistów" na pasja-informatyki
  4. dostanę 3 lata w zawieszeniu i wpis do kartoteki na 10 lat, bo posłuchałem "specjalistów" na pasja-informatyki
  5. zapytam czy mogę właściciela danych ( pewnie się nie zgodzi, ale nie zaszkodzi )

Polecam rozeznać samemu. Nas tutaj nie słuchać. Nikt za pana ani nie pójdzie siedzieć, ani nie zapłaci kary. Życzę mądrych i dojrzałych decyzji niepopartych opiniami dzieci, ale świadomością konsekwencji na całe życie.

Scrapping jest bardzo śliski.

komentarz 8 kwietnia przez reaktywny Nałogowiec (44,580 p.)

"...kto przetwarza dane osobowe...."  - to jest zupełnie co innego :)

Podobne pytania

+1 głos
1 odpowiedź 378 wizyt
+1 głos
1 odpowiedź 346 wizyt
0 głosów
1 odpowiedź 526 wizyt
pytanie zadane 19 sierpnia 2022 w Python przez NewbieProgrammer Początkujący (480 p.)

93,166 zapytań

142,177 odpowiedzi

321,946 komentarzy

62,495 pasjonatów

Advent of Code 2024

Top 15 użytkowników

  1. 688p. - dia-Chann
  2. 676p. - CC PL
  3. 675p. - Łukasz Piwowar
  4. 664p. - Marcin Putra
  5. 662p. - Łukasz Eckert
  6. 649p. - Michal Drewniak
  7. 641p. - rafalszastok
  8. 641p. - rucin93
  9. 629p. - Piotr Aleksandrowicz
  10. 629p. - Adrian Wieprzkowicz
  11. 621p. - Dawid128
  12. 612p. - Mikbac
  13. 611p. - ksalekk
  14. 606p. - Mariusz Fornal
  15. 602p. - Michał Telesz
Szczegóły i pełne wyniki

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj

Wprowadzenie do ITsec, tom 1 Wprowadzenie do ITsec, tom 2

Można już zamawiać dwa tomy książek o ITsec pt. "Wprowadzenie do bezpieczeństwa IT" - mamy dla Was kod: pasja (użyjcie go w koszyku), dzięki któremu uzyskamy aż 15% zniżki! Dziękujemy ekipie Sekuraka za fajny rabat dla naszej Społeczności!

...