Wyrażenia regularne do wyłuskania linków z pliku HTML

Wyrażenia regularne do wyłuskania linków z pliku HTML
MA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 7
0

Cześć.

chce uzyc wyrazenia regularnego do przeszukania pliku htm w celu wylapania linków

Kopiuj
<a href="">

i tekstu ktory jest zaraz za nimi

Kopiuj
<span>mojtekst</span>

napisałem takie wyrazenie:

Kopiuj
pattern = """r'<a href="(.*)">\s*<span>(.*%s.*)</span>""" % seekKey

no i interesuja mnie tylko znaleziska ktore zawieraja dane slowo kluczowe seekKey.

moje wyrazenie jednak nie dziala, mozecie mnie nakierowac?

Dzieki,
pozdrawiam

dodanie znaczników <code class="html"> - @furious programming

MA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 7
0

zauwazylem ze w przeszukiwanym pliku, linki a maja jeszcze poustawiane klasy o ktorych zapomnialem w wyrazeniu, moze to tu pies pogrzebany.

n0name_l
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 2412
0

Moze uzyj czegos normalnego do parsowania htmla? Na przyklad: http://www.crummy.com/software/BeautifulSoup/

MA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 7
0

niestety dalej nic to nie zmienilo, nie moge wylapac zadnego elementu.
obecne wyrazenie:

Kopiuj
pattern = """r''<a href='"('.*')" class=".*">\s*<span>('.*%s.*')'</span>'""" % seekKey

macie jakis pomysl?

n0name_l napisał(a):

Moze uzyj czegos normalnego do parsowania htmla? Na przyklad: http://www.crummy.com/software/BeautifulSoup/

Chcialbym przy okazji nauczyc sie stosowac wyrazenia regularne. Widzisz jakis blad w moim wyrazeniu?

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.