Język tutaj nie ma nic do rzeczy, to jest jedynie kwestia dobrania odpowiedniej biblioteki.
Chciałbym cię też uświadomić, że to nie jest łatwe zadanie i wymaga dość sporej wiedzy matematycznej (kompresji danych, transformacja Fouriera), sposobu przechowywania dźwięku/muzyki w plikach (czyli spora część wiedzy jest zawarta w matematyce dyskretnej).
Sposób wykrywania "beatów" jest zależny od rodzaju odtwarzanej muzyki i nie każda funkcja (okno) nadaje się do każdego typu muzyki, np okno Hamminga nadaje się do wykrywania rytmu w muzyce typowo elektronicznej/dubstep, ale zupełnie sobie nie radzi w przypadku muzyki klasycznej.
Jeżeli chcesz faktycznie rozumieć co piszesz, a nie miałeś nigdy wcześniej styczności z tym tematem to radzę ci się podszkolić we wspomnianych przeze mnie tematach.
Gdy ja pisałem swój twór, to wykorzystałem bibliotekę FMOD
http://www.fmod.org/ .