Uniwersalne pobieranie treści artykułów z różnych stron

Witam. Jak można uniwersalnie pobrać główną treść artykułu z każdej/z większości stron internetowych, pomijając sidebary, reklamy? Pisanie osobnego parsowania dla każdej strony jest raczej słabe, i każda strona ma swoje nazwy klas, inną strukturę html więc nie przychodzi mi nic do głowy. Przeczytałem też w internecie, chyba nawet na tym forum, jak ktoś zaproponował szukanie długiego stringu, i chyba nie byłoby to głupie, ale artykuł może mieć sporo znaczników, jakieś sekcje/cytaty/itd. i ciężko byłoby to odróżnić. Byłbym wdzięczny za jakieś wskazówki.

Nie da się tego zrobić uniwersalnie, sprawdź może strony mają RSS wtedy dasz radę

W teorii do tego miał (w html5) służyć znacznik article

Liczba odpowiedzi na stronę

Uniwersalne pobieranie treści artykułów z różnych stron

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami