Jak odczytać dane z pliku .html które są w formacie:
<tr>
<th>słowo</th>
<th>słowo</th>
</tr>
Bardzo bym prosił o nakierowanie.
Jak odczytać dane z pliku .html które są w formacie:
<tr>
<th>słowo</th>
<th>słowo</th>
</tr>
Bardzo bym prosił o nakierowanie.
Napisać prosty parser HTMLa lub skorzystać z gotowego.
Skorzystać z XML i XPath lub DOMDocument.
Skorzystać z HTML Agility Pack: http://htmlagilitypack.codeplex.com/ (.netowy odpowiednik BeautifulSoup)
Nie polecam traktowania tego jako XML (chyba że to na 100% walidujący się XHTML Strict, czyli coś co nie występuje realnie w internecie) - będzie może działać w prostych testowych przypadkach, ale nie zadziała dla żadnej prawdziwej strony.
Nie polecam pisania parsera HTML, bo 1) po co wynajdywać koło od nowa, 2) ciężko to zrobić w 100% poprawnie
Zarejestruj się i dołącz do największej społeczności programistów w Polsce.
Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.