Czytanie strony internetowej :: 4programmers.net

2013-02-01T17:26:01+01:00

Rejestracja: dni
Ostatnio: dni

Czego użyć gdy chcę wyciągnąć jakies informacje ze strony, która nie oferuje żadnego api? Chodzi o Androida dokładnie.

Shalom

2013-02-01T18:40:55+01:00

Rejestracja: dni
Ostatnio: dni
Lokalizacja: Space: the final frontier
Postów: 26433

Ściągnąć źródło i sparsować? o_O

2013-02-01T22:05:10+01:00

Rejestracja: dni
Ostatnio: dni

Rozumiem że ściągam i pisze parsowanie z wykorzystaniem SAX'a?
Czy muszę napisać obsługę całego drzewa? czy puścić i czekać aż trafi na wybrany element? bo chciałem drugą opcję i mi nie działa, pluje się do korzenia

Shalom

2013-02-01T23:41:45+01:00

Rejestracja: dni
Ostatnio: dni
Lokalizacja: Space: the final frontier
Postów: 26433

Zależy co chcesz wyciągać. Możesz parsować html jako xml jak bardzo chcesz, ale ja rozumiem że chcesz wyciągnąć konkretne informacje więc może wyrażeniem regularnym?

Kerai

2013-02-02T17:19:32+01:00

Rejestracja: dni
Ostatnio: dni
Lokalizacja: London

HTML się nie da parsować parserem xml

shusty

2013-02-04T00:36:57+01:00

Rejestracja: dni
Ostatnio: dni

Wyrażenia regularne czasem tak sobie radzą z takimi sprawami.
Dużo szybciej jest rozwiązać problem używając DOM.

2013-02-04T19:33:38+01:00

Rejestracja: dni
Ostatnio: dni

Wyrażenia regularne odpadają bo trwa to zdecydowanie za długo, przeszukuje mi linijka po linijce różne patterny. Chce to zrobić teraz XPath'em ale za cholerę nie mogę tego ruszyć, wszystkie info w necie są do banalnych plików XML, nie ma nigdzie jak pracować z wielkiemi stronami gdzie aby się dostać do elementu trzeba przejść z 10 elementów. Wpisywanie na sztywno od /html/ do końca coś mi nie działa:/

airborn

2013-02-05T06:54:12+01:00

Rejestracja: dni
Ostatnio: dni
Postów: 274

nowyTyp napisał(a):

Chce to zrobić teraz XPath'em ale za cholerę nie mogę tego ruszyć, wszystkie info w necie są do banalnych plików XML, nie ma nigdzie jak pracować z wielkiemi stronami gdzie aby się dostać do elementu trzeba przejść z 10 elementów.
W Chrome klikasz prawym przyciskiem na elemencie i Zbadaj element, ponownie prawym na interesującym Cię węźle i Copy XPath.