Parsowanie kodu html

MajQel
  • Rejestracja:prawie 13 lat
  • Ostatnio:ponad 9 lat
  • Postów:92
0

Mam dosc rozlegly kod html i chcialbym z niego wyciagnac pewne rzeczy. Czytalem troche o wyrazeniach regularnych ale ponoc one nie sa zalecane do tego typu operacji. Nie wiem czy lepiej/szybciej sie posluzyc bedzie stringiem czy w jeszcze jakis inny sposob. Ma ktos jakas rade?

MajQel
  • Rejestracja:prawie 13 lat
  • Ostatnio:ponad 9 lat
  • Postów:92
0

chce wiedziec w sumie jak usunac spacje i to co miedzy znakami <> dalej sobie z reszta poradze

RE
Moderator
  • Rejestracja:około 18 lat
  • Ostatnio:około rok
0

Zależy co tak naprawdę chcesz zrobić. Parsowanie oznacza poznanie semantyki całego dokumentu, kontekstu, w jakim znajdują się poszczególne elementy. Tego za pomocą samych wyrażeń regularnych zrobić się nie da, ale jeżeli chodzi o wyciągnięcie jakiejś wartości w jednym znaczniku to nie ma problemu.

maszynaz
  • Rejestracja:prawie 18 lat
  • Ostatnio:ponad 12 lat
0

Ja znalazłem ciekawy darmowy parser kodu HtmlAgilityPack. Przejrzyj go. Ja jeszcze go nie przetestowałem więc nie wiem jak szybki jest.


"Wszystko co może być wynalezione, zostało wynalezione"
Charless H. Duell - komisarz urzędu patentowego U.S., 1899
edytowany 1x, ostatnio: maszynaz
MajQel
  • Rejestracja:prawie 13 lat
  • Ostatnio:ponad 9 lat
  • Postów:92
0

juz zdazylem samemu zrobic funkcje ktora by to ogarniala

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.