Uniwersalne pobieranie treści artykułów z różnych stron

0

Witam. Jak można uniwersalnie pobrać główną treść artykułu z każdej/z większości stron internetowych, pomijając sidebary, reklamy? Pisanie osobnego parsowania dla każdej strony jest raczej słabe, i każda strona ma swoje nazwy klas, inną strukturę html więc nie przychodzi mi nic do głowy. Przeczytałem też w internecie, chyba nawet na tym forum, jak ktoś zaproponował szukanie długiego stringu, i chyba nie byłoby to głupie, ale artykuł może mieć sporo znaczników, jakieś sekcje/cytaty/itd. i ciężko byłoby to odróżnić. Byłbym wdzięczny za jakieś wskazówki.

1

Nie da się tego zrobić uniwersalnie, sprawdź może strony mają RSS wtedy dasz radę

0

W teorii do tego miał (w html5) służyć znacznik article

1 użytkowników online, w tym zalogowanych: 0, gości: 1