• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

[Poradnik] Pseudo switch od stringów (C++11)

Object Storage Arubacloud
+11 głosów
320 wizyt
pytanie zadane 17 czerwca 2016 w Nasze poradniki przez MetGang Nałogowiec (34,360 p.)

Witam. Ostatnimi czasy na forum pojawiło się parę tematów dotyczących switcha, który może przyjmować wartości typu string (a dokładniej literal string). Ze względu na sposób działania mechanizmu switcha taka operacja jest niemożliwa do wykonania, gdyż możemy korzystać jedynie z liczb całkowitych (np. 1, -8, 'a').

W C++11 (-std=C++11) specyfikator constexpr umożliwia nam wykonywanie pewnych operacji jeszcze w trakcie kompilacji i jego użycie będzie tutaj kluczowe. Przykładowe działanie:

// kod
constexpr int x = 4;
int y = x;
// w rzeczywistości będzie dla kompilatora wyglądał tak
int y = 4;

Można więc rzec, że constexpr jest aliasem dla pewnych stałych wartości - literałów (w tym wypadku dla 4). Dzięki temu możliwe jest napisanie takiego kodu (wynik działania oczywisty):

constexpr int _1 = 1;
constexpr int _2 = 2;

int x = 2;
switch(x)
{
    case _1: std::cout<<"To jest jeden"; break;
    case _2: std::cout<<"To jest dwa"; break;
}

Bez specyfikatora constexpr otrzymamy następujące błędy:
error: the value of '_1' is not usable in a constant expression
note: 'int _1' is not const

A więc mając odpowiednią funkcję przerabiającą literał stringa na postać liczbową, bez problemu możemy otrzymać pseudo switch od stringów. Tak prezentuje się przykładowy kod (u64 jest typedefem od unsigned long long):

std::string Str = "Ala ma kota";
u64 ID = HashStr(Str);

switch(ID)
{
    case_str("Ala ma kota"): /* kod */ break;
    case_str("Ala nie ma kota"): /* kod */ break;
    case_str("To jednak dziala :D"): /* kod */ break;
}

Przejdźmy teraz do samej funkcji, twierdząc po nazwie, hashującej. W moim przypadku opiera się ona na algorytmie FNV-1a (Fowler–Noll–Vo), którego opis można znaleźć bez problemu na Wikipedii. Wyjaśniając w skrócie działanie algorytmu - dla każdego bajtu ciągu znaków wykonujemy operację XORa logicznego oraz mnożenia z wykorzystaniem dwóch liczb pierwszych.

hash = FNV_offset_basis
for each byte_of_data to be hashed
    hash = hash XOR byte_of_data
    hash = hash × FNV_prime
return hash

Po zaimplementowaniu tego algorytmu w postaci rekurencyjnej (ze względu na restrykcyjne wymagania specyfikatora constexpr) ma on postać następującą:

constexpr u64 HashStr(const char* Src, u64 Value = 0xcbf29ce484222325ull)
{
    return (*Src) ? HashStr(Src+1,((*Src)^Value)*0x100000001b3ull) : Value;
}

// plus wersja dla std::string dla ułatwienia zapisu (NIE jest ona constexpr)
inline u64 HashStr(const std::string& Str)
{
    return HashStr(Str.data());
}

// plus makro dla uładnienia konstrukcji switcha
#define case_str(x) case HashStr(x)

Istnieje teoretyczna możliwość kolizji dwóch wartości hashowych, lecz osobiście się z takową nie spotkałem i nie sądzę żeby była ona dotkliwa. W razie doraźnych problemów można zastosować inny algorytm hashujący.

Co do sensu stosowania tego zabiegu:
- szybkość przy większej ilości case'ów i dłuższych stringach
- wygoda stosowania (wiemy dokładnie od jakiej wartości przełączamy)
- satysfakcja ze zrobienia czegoś dość zaawansowanego
- zrozumienie constexpr oraz pojęcie jego możliwości optymalizacyjnych

Przykłady użycia:
- wszelkiego rodzaju skrypty (wykonywanie funkcji w zależności od danego ciagu znaków)
- ONP (jak wyżej)
- tworzenie aliasów
- enum E { _1 = Global["WindowX"] } // gdzie Global to zmienna constexpr
- co tylko Wam do głowy przyjdzie : )
 

Pytania, oceny, opinie, komentarze i ewentualne prośby o inne poradniki proszę zamieszczać niżej.

Mam nadzieję, że komuś poradnik się przyda. Dziękuję za uwagę i życzę miłego kodowania ^^
 

Linki:
http://en.cppreference.com/w/cpp/language/constexpr
https://pl.wikipedia.org/wiki/Funkcja_skr%C3%B3tu
https://en.wikipedia.org/wiki/Fowler%E2%80%93Noll%E2%80%93Vo_hash_function

komentarz 17 czerwca 2016 przez niezalogowany
W ramach ciekawostki dorzucę porównanie kilku algorytmów hashujących:

https://programmers.stackexchange.com/questions/49550/which-hashing-algorithm-is-best-for-uniqueness-and-speed
komentarz 17 czerwca 2016 przez draghan VIP (106,230 p.)
Fajny wpis, upvote. :)

Zaloguj lub zarejestruj się, aby odpowiedzieć na to pytanie.

Podobne pytania

+1 głos
2 odpowiedzi 519 wizyt
pytanie zadane 13 maja 2021 w C i C++ przez Mavimix Dyskutant (8,390 p.)
+1 głos
7 odpowiedzi 3,381 wizyt
pytanie zadane 9 października 2015 w C i C++ przez C☺ndzi Stary wyjadacz (12,100 p.)
0 głosów
1 odpowiedź 207 wizyt
pytanie zadane 26 września 2022 w C i C++ przez RufinB Obywatel (1,830 p.)

92,570 zapytań

141,422 odpowiedzi

319,643 komentarzy

61,958 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...