Szczęść Boże i ratuj się kto może,
chciałem podpytać o transformery w AI. Są stosowane głównie w NLP (większość LLM oparta jest o transformery), ale też od około 2-3 lat stosuje się Vision Transformers do zadań w CV. Transformery niemal zaorały dotychczasowe metody i algorytmy AI, niedługo będzie można je puścić do kosza ;). Z pewnością warto poznać, Transformatory ale też nie jest to coś trywialnego.
Pytania do osób pracujących w AI: Czy ich dogłębna znajomość jest potrzebna, wymagana w pracy w NLP / CV? Czy coś tam o nich wiecie z teorii, a skupiacie się na praktycznym ich wykorzystaniu, czyli traktujecie je jako "czarną skrzynkę" (lub "czarną magię" :) ) ?? Co mimo wszystko trzeba / warto znać z części teoretycznej dotyczącej Transformers?
BTW. Transformatory wyparły stare metody, algorytmy AI, a już jest coś co - po dopracowaniu - może wyprzeć transformatory - MAMBA :)
Będę wdzięczny za jakąś przystępną i w miarę krótką (kilkadziesiąt stron) literaturę na temat Transformers po polsku. Ciotka Google wypluwa liczne artykuły, ale nie znalazłem żadnej książki czy skryptu po polsku (poza pozycją Lewis Tunstall).
Dzięki za wszelkie uwagi i podpowiedzi!