• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Konwersja do zapisu z zerem wiodącym danych z pliku csv

VPS Starter Arubacloud
0 głosów
83 wizyt
pytanie zadane 23 lutego 2023 w Python przez benek111 Początkujący (260 p.)
Witam.

Mam plik .csv , w którym jest kilka kolumn oddzielonych znakiem " :" (średnik). Część kolumn ma stałą liczbę znaków a część zmienną. np. 2023;12;1;5;0980 ( kol1- 4 znaki, kol2 - 1 lub 2, kol3 - 1 lub 2 itd.

Potrzebuję przekonwertować plik tak, żeby w tych kolumnach gdzie są 1 lub 2 znaki - w postaci liczby -  zawsze liczba była zapisana na dwóch pozycjach czyli nie 1 a 01 nie 5 a 05 ( dodanie zer wiodących)..

Jeśli można, proszę o podpowiedź jak zrobić to Pythonie.
komentarz 24 lutego 2023 przez kretiku Nowicjusz (140 p.)
1. Wczytać plik normalnie, nie modułem csv

2. Iterować po liniach

3. Rozbić linię na listę po: split(';')

4. Przejść po tej liście i len(elementu) == 1 to element = '0' + element

5. Połączyć listę: ';'.join(lista)

6. Dodać listę jako wiersz do pliku wyjściowego.

To tak łopatologicznie. Choć zapewne można to zrobić prościej wyrażeniami regularnymi, ale ja tego aż tak nie znam.

1 odpowiedź

0 głosów
odpowiedź 26 lutego 2023 przez VBService Ekspert (251,210 p.)
edycja 26 lutego 2023 przez VBService

Tak jak już wspomniał @kretiku;

... zapewne można to zrobić prościej wyrażeniami regularnymi,

np. on-line

import re

with open('nazwa_pliku.csv', 'r') as file:
    contents = file.read()

print(contents)

# print(re.sub(r';(\d)(?=;)', r';0\1', contents))
print(re.sub(r';(\d)(?=[^0-9])', r';0\1', contents))

 

re.sub() to funkcja w Python-ie służąca do wyszukiwania i zamiany wzorców za pomocą wyrażeń regularnych.

re to moduł Python-a dla operacji na wyrażeniach regularnych.

r';(\d)(?=[^0-9])' to wyrażenie regularne, które będzie używane jako wzorzec do wyszukiwania. Jest to wzorzec dla pojedynczej cyfry między dwoma średnikami.

  • r na początku oznacza, że łańcuch jest surowy (ang. raw), co oznacza, że ​​backslash-e nie są interpretowane specjalnie przez Python-a.
  • ; oznacza średnik, który musi wystąpić przed wyszukiwaną cyfrą.
  • (\d) oznacza pojedynczą cyfrę.
  • (?=[^0-9]) to wyrażenie (lookahead), które oznacza, że ​​następna pozycja w tekście musi nie być cyfrą.

Znaczenie r';0\1' jest takie, że po znalezieniu pasującego wzorca, zamienia on cyfrę, którą znalazł, na siebie samą, ale z wiodącym zerem, czyli np. 1 na 01.

\1 w zamianie oznacza grupę dopasowania z wyrażenia regularnego.

pytanie zadane 28 lutego 2023 w Python przez benek111 Początkujący (260 p.) dodanie zer wiodących do danych z pliku

Podobne pytania

0 głosów
0 odpowiedzi 203 wizyt
0 głosów
0 odpowiedzi 1,333 wizyt
pytanie zadane 1 lutego 2018 w PHP przez hiper007 Stary wyjadacz (11,270 p.)
0 głosów
1 odpowiedź 404 wizyt
pytanie zadane 5 września 2019 w Python przez Al3x Użytkownik (870 p.)

92,452 zapytań

141,262 odpowiedzi

319,080 komentarzy

61,854 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Akademia Sekuraka 2024 zapewnia dostęp do minimum 15 szkoleń online z bezpieczeństwa IT oraz dostęp także do materiałów z edycji Sekurak Academy z roku 2023!

Przy zakupie możecie skorzystać z kodu: pasja-akademia - użyjcie go w koszyku, a uzyskacie rabat -30% na bilety w wersji "Standard"! Więcej informacji na temat akademii 2024 znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...