• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Skrypt Pythona znajdujący i usuwający powtarzające się pliki jpg

Object Storage Arubacloud
0 głosów
293 wizyt
pytanie zadane 21 grudnia 2016 w Nasze projekty przez obl Maniak (51,280 p.)
Napisałem jakiś czas temu w Pythonie 3.5 mały skrypt usuwający mi z podanej lokalizacji pliki jpg, które się powtarzają. Program porównuje pliki dwuetapowo: najpierw pod względem rozmiaru zajmowanej pamięci na dysku, później pod względem zawartości. Kod programu na GitHub-ie https://github.com/Obliczeniowo/compare_files/blob/master/Compare_file.py

1 odpowiedź

+1 głos
odpowiedź 21 grudnia 2016 przez adrian17 Ekspert (344,860 p.)
wybrane 21 grudnia 2016 przez obl
 
Najlepsza

Nie wiem jakie jest pytanie :)

Kilka szybkich uwag:

if not path.endswith("/") or not path.endswith("\\"):
        path += "/";

Polecam zapoznanie się z os.path.join lub nowszym pathlib.Path.

open(some_path, "w", -1, "utf-8")
=>
open(some_path, "w", encoding="utf-8")
if len(filelists):
=>
if filelists:
list(os.walk(path))[0][2]

Tu z kolei polecam glob().

if os.path.exists(path + file1):

Po co, jeśli wiesz że taki plik istnieje skoro wyszedł z os.walk?

komentarz 21 grudnia 2016 przez obl Maniak (51,280 p.)
edycja 21 grudnia 2016 przez obl
if os.path.exists(path + file1):

zostało mi po tym jak usuwałem pliki wewnątrz pętli, zostawiłem bo w trakcie działania programu ktoś może coś zmienić, np. nazwę któregoś z plików w trakcie działania programu i wtedy by się wywalił. Czas wykonania na 5000 plików trwa trochę. Co do reszty uwag dzięki, przydadzą się. Ja w Pythonie za dużo nie programuję ale całkiem ciekawy to język i ma potencjał dlatego ostatnio się nim bardziej zainteresowałem.

Podobne pytania

0 głosów
0 odpowiedzi 389 wizyt
0 głosów
0 odpowiedzi 230 wizyt
pytanie zadane 5 marca 2018 w Nasze projekty przez obl Maniak (51,280 p.)
0 głosów
2 odpowiedzi 2,603 wizyt
pytanie zadane 29 maja 2018 w HTML i CSS przez szejkus Użytkownik (540 p.)

92,576 zapytań

141,426 odpowiedzi

319,650 komentarzy

61,961 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...