Odczytywanie z pliku tekstowego

pytanie zadane 17 sierpnia 2023 w C i C++ przez Zuzan Początkujący (390 p.)

Witam. Mam do napisania następującą funkcje:

Wczytywanie słownika

struct word_t** read_words(const char* filename, enum error_t* errcode);

Funkcja wczytuje słownik z pliku filename do pamięci oraz informuje kod wywołujący o sukcesie bądź porażce całej operacji, ustawiając kod błędu typu error_t w polu, danym wskaźnikiem errcode. Podanie obu wskaźników jest wymagane. W przypadku porażki funkcja zwraca NULL.

Słownik, dany plikiem o nazwie filename, ma mieć strukturę tekstową, gdzie w każdym poprawnym wierszu ma znajdować się para słów: słowo polskie oraz jego angielski odpowiednik, rozdzielone spacją. Przykład:

zdanie sentence⏎
wielki great⏎
myslec think⏎
w_lewo left⏎
⏎

Słowo w tym zadaniu jest zdefiniowane jako nierozłączny ciąg znaków niebiałych (ang. non-white space). Proszę zwrócić uwagę, iż polskie słowa zapisane są całkowicie w formie łacińskiej, bez znaków narodowych typu ąęćńź, itp. Słowa mogą zawierać podkreślnik, np. w_lewo. Plik nie będzie zawierał uszkodzonych danych. Może jednak zawierać pustą linię na końcu.

Wartość zwracana

Funkcja zwraca:

NULL w przypadku porażki (plus kod błędu w *errcode) lub
wskaźnik do tablicy wskaźników do struktur word_t, reprezentujących pary słów PL-EN (plus kod błędu ERROR_OK w *errcode).
Wskaźnik errcode jest wymagany; jego brak ma natychmiast kończyć funkcję z wartością NULL.

Struktura word_t ma mieć następującą postać:

struct word_t {
    char* text_pl;
    char* text_en;
};

Tablica wskaźników do struktur word_t ma być zakończona dodatkowym elementem - terminatorem w postaci wartości NULL.

Kody błędów

Funkcja określa status przeprowadzonej operacji wczytywania za pomocą stałych typu wyliczeniowego error_t. Typ należy sformułować następująco:

enum error_t{
  ERROR_OK,
  ERROR_INCORRECT_PARAMETERS,
  ERROR_FILE_IO,
  ERROR_MEMORY
};

W przypadku sukcesu funkcja zwraca odpowiedni wskaźnik oraz ustawia kod błędu ERROR_OK.
W przypadku przekazania niepoprawnych parametrów funkcja ustawia kod błędu ERROR_INCORRECT_PARAMETERS. Zwróć uwagę, że nie jest to możliwe w przypadku problemów z argumentem errcode.
W przpadku wszelkich problemów z operacjami wejścia/wyjścia, formatem słownika itp., funkcja ustawia kod błędu ERROR_FILE_IO.
W przypadku braku pamięci funkcja ustawia ERROR_MEMORY.

Wymagania pamięciowe

Funkcja nie może zaalokować więcej pamięci niż jest to niezbędne do posiadania w pamięci słownika, wczytanego z pliku.

Przykład wywołania

Słownik:

zdanie sentence⏎
wielki great⏎
myslec think⏎

Mój kod wygląda następująco:

#include "translator.h"
#include <stdlib.h>
#include <stdio.h>

void delete_words(struct word_t** tab){
    if(tab==NULL||*tab==NULL) return;
    struct word_t *translator = *tab;
    int count=0;
    while((translator+count)->text_pl!=NULL){
        free((translator+count)->text_pl);
        free((translator+count)->text_en);
        count++;
    }
    free(translator);
    free(tab);
    tab=NULL;
}

struct word_t **read_words(const char *filename, enum error_t *errcode) {
    if (filename == NULL || errcode == NULL) {
        if (errcode != NULL)
            *errcode = ERROR_INCORRECT_PARAMETERS;
        return NULL;
    }
    FILE *fp = fopen(filename, "r");
    if (fp == NULL) {
        *errcode = ERROR_FILE_IO;
        return NULL;
    }
    char c;
    int count = 0;
    while (feof(fp) == 0) {
        if (fscanf(fp, "%c", &c) != 1&&feof(fp) == 0) {
            *errcode = ERROR_FILE_IO;
            fclose(fp);
            return NULL;
        }
        if (c == '\n')
            count++;
    }
    fseek(fp, -3, SEEK_END);
    fscanf(fp, "%c", &c);
    if (c == '\n')
        count--;
    fseek(fp, SEEK_SET, 0);
    struct word_t **translator=NULL;
    translator=(struct word_t **) calloc(1, sizeof(struct word_t*));
    if (translator == NULL) {
        fclose(fp);
        *errcode = ERROR_MEMORY;
        return NULL;
    }
    *translator = (struct word_t *) calloc(count, sizeof(struct word_t));
    if (*translator == NULL) {
        fclose(fp);
        free(translator);
        *errcode = ERROR_MEMORY;
        return NULL;
    }
    int count_2 = 0, w_pl, w_ang, place=0;
    while (count_2 < count-1) {
        c = 'a';
        w_pl = 0;
        w_ang = 0;
        //polskie
        while (c != ' ') {
            if (fscanf(fp, "%c", &c) != 1) {
                *errcode = ERROR_FILE_IO;
                fclose(fp);
                delete_words(translator);
                return NULL;
            }
            w_pl++;
        }
        //angielskie
        while (c != '\n') {
            if (fscanf(fp, "%c", &c) != 1) {
                *errcode = ERROR_FILE_IO;
                fclose(fp);
                delete_words(translator);
                return NULL;
            }
            w_ang++;//zawsze o jeden wiecej liczy niz jest liter w słowie
        }
        (*translator+count_2)->text_pl = (char *) calloc(w_pl - 1, sizeof(char));
        if ((*translator+count_2)->text_pl == NULL) {
            fclose(fp);
            delete_words(translator);
            *errcode = ERROR_MEMORY;
            return NULL;
        }
        (*translator+count_2)->text_en = (char *) calloc(w_ang - 1, sizeof(char));
        if ((*translator+count_2)->text_en == NULL) {
            fclose(fp);
            delete_words(translator);
            *errcode = ERROR_MEMORY;
            return NULL;
        }
        place=w_ang+w_pl;
        fseek(fp,-place-1, SEEK_CUR);
        for(int i=0; i<w_pl-1; i++)
            fscanf(fp, "%c", (*translator+count_2)->text_pl+i);
        fscanf(fp, "%c", &c);
        for(int i=0; i<w_ang-1; i++)
            fscanf(fp, "%c", (*translator+count_2)->text_en+i);
        fscanf(fp, "%c", &c);
        count_2++;

    }

    *errcode = ERROR_OK;
    return translator;
}

char** translate_words( struct word_t** tab, int n, ...){
    return NULL;
}

Napotykam problem ze zwracana wartością przez fscanf w tym miejscu:

while (c != ' ') {
            if (fscanf(fp, "%c", &c) != 1) {
                *errcode = ERROR_FILE_IO;
                fclose(fp);
                delete_words(translator);
                return NULL;
            }
            w_pl++;
        }

Napisana przeze mnie funkcja jest sprawdzana przez testy automatyczne. Fscanf zwraca wartość różną od 1 dla poprawnego pliku tekstowego podanego w testach, natomiast gdy przekopiuje jego zawartość do pliku tekstowego o innej nazwie to funkcja działa już prawidłowo. Nie wiem czym może być to spowodowane, że mimo tej samej zawartości pliku (a tylko innej nazwie) funkcja fscanf zwraca różne wartości.

Byłabym wdzięczna za wszelkie wskazówki. Z góry dziękuję.

komentarz 18 sierpnia 2023 przez reaktywny Nałogowiec (40,990 p.)

Bardzo długi i zagmatwany ten kod :) Podzieliłbym go chociaż na funkcje. Choć mam wrażenie, że część kodu jest zbędna.

komentarz 18 sierpnia 2023 przez j23 Mędrzec (194,920 p.)

@Zuzan,

struct word_t **translator=NULL;

translator=(struct word_t **) calloc(1, sizeof(struct word_t*));
...

*translator = (struct word_t *) calloc(count, sizeof(struct word_t));
...

Ja tu sensu nie widzę. Wystarczy samo:

struct word_t *translator = (struct word_t *) calloc(count, sizeof(struct word_t));

Zamiast najpierw liczyć, ile masz linii w pliku, po prostu czytaj je i na bieżąco i dodawaj do tablicy - użyj realloc. Słowa też czytaj do jakiegoś bufora np. char[50] i daj:

translator[count_2].text_pl = strcpy(malloc(strlen(buf) + 1), buf);
...

translator[count_2].text_en = strcpy(malloc(strlen(buf) + 1), buf);

Można użyć też strdup, jeśli kompilator obsługuje standard C23.

komentarz 25 sierpnia 2023 przez Jan Czajkowski Nowicjusz (100 p.)

@Zuzan,

Przetestowałem fragment Twojego kodu i też byłem zaskoczony, bo w poniższej pętli

  while (!feof(fp))
    {
      printf("%d", fscanf(fp, "%c", &c)); 
    }

program wypisuje "1" dla każdego znaku z pliku, ale dodatkowo na końcu wypisuje "-1". Wygląda mi na to, że w momencie, gdy przeczytamy już cały plik, feof(fp) nadal zwraca 0, a dopiero gdy jeszcze odczytamy znak końca pliku, to feof(fp) będzie niezerowe. Przeczytałem w www.geeksforgeeks.org/eof-and-feof-in-c/, że feof służy tylko do rozróżnienia, czy niepowodzenie odczytu np. przez getc() jest spowodowane końcem pliku, czy jakimś błędem.

Jeśli się mylę, niech ktoś mnie poprawi.

komentarz 25 sierpnia 2023 przez Oscar Nałogowiec (29,320 p.)

Masz rację, ogólnie sprawdzanie eof jako zabezpieczenie przed błędnym odczytem jest zle, przecież w pliku mogą pozostać np. tylko jakieś spacje i jak będziemy chcieli wczytać znak (%c) to przejdzie, ale jak będziemy próbować wczytać liczbę (%d) to się nie uda. Nie da się sprawdzić 'z góry' czy wczytanie sie uda. Należy sprawdzać wynik funkcji wczytującej. Akurat funkcje rodziny scanf zwracają liczbę poprawnie wczytanych formatów (tych wszystkich %c, %s, %d itp). W podanym kodzie jest jeden format %c więc normalnie funkcja zwraca 1.

Pętla powinna zaczynać się:

while (fscanf(fp, "%c", &c) == 1)
{
   ...
}

Zaloguj lub zarejestruj się, aby odpowiedzieć na to pytanie.

Podobne pytania

0 głosów

3 odpowiedzi 803 wizyt

Odczytywanie z pliku tekstowego. C++

pytanie zadane 23 października 2017 w C i C++ przez kris6700 Początkujący (260 p.)

0 głosów

1 odpowiedź 893 wizyt

Odczytywanie z pliku tekstowego C++ błąd

pytanie zadane 5 lutego 2018 w C i C++ przez AgaLuk Nowicjusz (210 p.)

0 głosów

2 odpowiedzi 835 wizyt

Odczytywanie informacji z pliku tekstowego

pytanie zadane 5 listopada 2017 w Java przez Akiro Bywalec (2,910 p.)

Odczytywanie z pliku tekstowego

Zaloguj lub zarejestruj się, aby skomentować.

Zaloguj lub zarejestruj się, aby odpowiedzieć na to pytanie.

Podobne pytania

O działaniu forum

Pasja informatyki w internecie

Polecane miejsca w sieci