• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Konwersja do zapisu z zerem wiodącym danych z pliku csv

Object Storage Arubacloud
0 głosów
88 wizyt
pytanie zadane 23 lutego 2023 w Python przez benek111 Początkujący (260 p.)
Witam.

Mam plik .csv , w którym jest kilka kolumn oddzielonych znakiem " :" (średnik). Część kolumn ma stałą liczbę znaków a część zmienną. np. 2023;12;1;5;0980 ( kol1- 4 znaki, kol2 - 1 lub 2, kol3 - 1 lub 2 itd.

Potrzebuję przekonwertować plik tak, żeby w tych kolumnach gdzie są 1 lub 2 znaki - w postaci liczby -  zawsze liczba była zapisana na dwóch pozycjach czyli nie 1 a 01 nie 5 a 05 ( dodanie zer wiodących)..

Jeśli można, proszę o podpowiedź jak zrobić to Pythonie.
komentarz 24 lutego 2023 przez kretiku Nowicjusz (140 p.)
1. Wczytać plik normalnie, nie modułem csv

2. Iterować po liniach

3. Rozbić linię na listę po: split(';')

4. Przejść po tej liście i len(elementu) == 1 to element = '0' + element

5. Połączyć listę: ';'.join(lista)

6. Dodać listę jako wiersz do pliku wyjściowego.

To tak łopatologicznie. Choć zapewne można to zrobić prościej wyrażeniami regularnymi, ale ja tego aż tak nie znam.

1 odpowiedź

0 głosów
odpowiedź 26 lutego 2023 przez VBService Ekspert (253,420 p.)
edycja 26 lutego 2023 przez VBService

Tak jak już wspomniał @kretiku;

... zapewne można to zrobić prościej wyrażeniami regularnymi,

np. on-line

import re

with open('nazwa_pliku.csv', 'r') as file:
    contents = file.read()

print(contents)

# print(re.sub(r';(\d)(?=;)', r';0\1', contents))
print(re.sub(r';(\d)(?=[^0-9])', r';0\1', contents))

 

re.sub() to funkcja w Python-ie służąca do wyszukiwania i zamiany wzorców za pomocą wyrażeń regularnych.

re to moduł Python-a dla operacji na wyrażeniach regularnych.

r';(\d)(?=[^0-9])' to wyrażenie regularne, które będzie używane jako wzorzec do wyszukiwania. Jest to wzorzec dla pojedynczej cyfry między dwoma średnikami.

  • r na początku oznacza, że łańcuch jest surowy (ang. raw), co oznacza, że ​​backslash-e nie są interpretowane specjalnie przez Python-a.
  • ; oznacza średnik, który musi wystąpić przed wyszukiwaną cyfrą.
  • (\d) oznacza pojedynczą cyfrę.
  • (?=[^0-9]) to wyrażenie (lookahead), które oznacza, że ​​następna pozycja w tekście musi nie być cyfrą.

Znaczenie r';0\1' jest takie, że po znalezieniu pasującego wzorca, zamienia on cyfrę, którą znalazł, na siebie samą, ale z wiodącym zerem, czyli np. 1 na 01.

\1 w zamianie oznacza grupę dopasowania z wyrażenia regularnego.

pytanie zadane 28 lutego 2023 w Python przez benek111 Początkujący (260 p.) dodanie zer wiodących do danych z pliku

Podobne pytania

0 głosów
0 odpowiedzi 221 wizyt
0 głosów
0 odpowiedzi 1,355 wizyt
pytanie zadane 1 lutego 2018 w PHP przez hiper007 Stary wyjadacz (11,270 p.)
0 głosów
1 odpowiedź 421 wizyt
pytanie zadane 5 września 2019 w Python przez Al3x Użytkownik (870 p.)

92,579 zapytań

141,432 odpowiedzi

319,664 komentarzy

61,964 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...