Witam.
Mam problem tego typu , że dostałem do zrobienia program w c++ który odpowiednio sparsuje plik html/xhtml.
Następnie wczyta dane programów do zmiennych, a po tym wyświetli ten program tv na ekranie.
Dla uproszczenia dostałem tylko wyświetlenie programu telewizyjnego na cały dzień dla 1 kanału.
Nie mam pojęcia od czego zacząć( nie liczę na gotowy kod ) , więc w razie możliwości wesprzyjcie dobrym pomysłem :)
Przeglądając forum nie zauważyłem wątku, który by wiązał się z moją sprawą.
Pozdrawiam !
Nie wiemy jak zbudowany jest ten plik HTML, więc niewiele można powiedzieć.
O ile nie jest to nic zaawansowanego, powinny wystarczyć zwykłe operacje na tekście (tj.wyszukiwanie znacznika i wycinanie tekstu).
Mam pobrać dowolną stronę internetową z programem tv.( ręcznie nie musi robić tego program)
I chodzi mi o to w jaki sposób wydobyć te informację .
Np z tej strony http://www.tv.pl/home/stacja/125.xhtml
Zobacz w źródło tamtej strony; interesujące nas fragmenty są od:
<table class="program" cellspacing="0" cellpadding="0" border="0">
do </table>
(każdy program jest w tej tabeli opisany, tj.godzina i jego nazwa)
Czyli trzeba będzie wycinać tekst od <table class="(...)
do </table>
.
W nim szukamy:
<div class="godzina">
...</div>
oraz
<a class="tytul_pelny" (...)
...</a>
I wycinamy znajdujący się pomiędzy nimi tekst; będą to odpowiednio: godzina oraz tytuł programu, po czym ponawiamy od początku.
To jest oczywiście wersja najprostsza i wykrzaczy się przy zmianie najmniejszej części strony :P
Akurat ta strona będzie raz pobrana a więc to jest rewelacyjny pomysł.
I jeszcze jedno pytanie w jaki sposób to sparsować bo żadnego konstruktywnego tutorialu nie znalazłem w necie .
Poczytaj o operacjach na tekście w C++.
W Pascalu wystarczyłoby Pos
oraz Copy
, C++ zapewne posiada takie odpowiedniki.
Super!! :D
Dzięki wielkie za pomoc , teraz jakoś powinienem ruszyć z miejsca :)