Jeśli nie chcesz korzystać z rozwiązania zaproponowanego przez @Comandeer, to takie zabiegi są realizowane przez sztuczne sieci neuronowe.
Fajny, ambitny projekt, ale w obliczu
... jestem dopiero początkujący
, to zdecydowanie skorzystaj ze SpeechRecognition.