Ja bym w pierwszej kolejności poszukał czy dana strona wystawia jakieś publiczne API. z Takim parsowaniem html trzeba uważac, bo za chwilę coś zmienią i masz problem, a API prawdopodobnie zostanie ok. Dzisiaj wiele stron wystawia na publiku swoje API więc myślę, że na pewno coś znajdziesz.