Tak na prawdę musisz pobrać treść strony. Potem to już Twoja sprawa czego użyjesz żeby pozyskać sam content.
W PHP korzystałbym ze strip_tags, albo bardziej Symfony Browserkit Component + DOMCrawler.
W JS wystarczy że złapiesz document.body i innerText, lub textContent.