Zależy jakie zdjęcia ma rozpoznawać.... Jeśli tak jak piszesz, zwierzaki, to które? Bo chyba nie wszystkie? Musisz mieć zdjęcia pogrupowane i etykietowane, nauczyć sieć (zwykle wykorzystuje się CNN) i dopiero gotowy model wstawić na jakiś serwer czy chmurę z API (REST czy GraphQL).
Gotowe API Google rozpoznaje obiekty (oczywiście nie wszystkie), ale z tego co się orientuję nie poda Ci rasy / gatunku zwierzaka...A jeśli poda to w wąskim zakresie, najbardziej popularnych.
W praktyce, jak chcesz coś podobnego zrobić to musisz sam zbudować i wytrenować sieć, a do tego potrzeba wielu (dziesiątki tysięcy i więcej) zdjęć.