Wyrażenia regularne do wyłuskania linków z pliku HTML

2014-10-13T18:52:36+02:00

Cześć.

chce uzyc wyrazenia regularnego do przeszukania pliku htm w celu wylapania linków

Kopiuj

<a href="">

i tekstu ktory jest zaraz za nimi

Kopiuj

<span>mojtekst</span>

napisałem takie wyrazenie:

Kopiuj

pattern = """r'<a href="(.*)">\s*<span>(.*%s.*)</span>""" % seekKey

no i interesuja mnie tylko znaleziska ktore zawieraja dane slowo kluczowe seekKey.

moje wyrazenie jednak nie dziala, mozecie mnie nakierowac?

Dzieki,
pozdrawiam

dodanie znaczników <code class="html"> - @furious programming

2014-10-13T19:17:47+02:00

zauwazylem ze w przeszukiwanym pliku, linki a maja jeszcze poustawiane klasy o ktorych zapomnialem w wyrazeniu, moze to tu pies pogrzebany.

2014-10-13T19:19:24+02:00

Moze uzyj czegos normalnego do parsowania htmla? Na przyklad: http://www.crummy.com/software/BeautifulSoup/

2014-10-13T19:20:56+02:00

niestety dalej nic to nie zmienilo, nie moge wylapac zadnego elementu.
obecne wyrazenie:

Kopiuj

pattern = """r''<a href='"('.*')" class=".*">\s*<span>('.*%s.*')'</span>'""" % seekKey

macie jakis pomysl?

n0name_l napisał(a):

Moze uzyj czegos normalnego do parsowania htmla? Na przyklad: http://www.crummy.com/software/BeautifulSoup/

Chcialbym przy okazji nauczyc sie stosowac wyrazenia regularne. Widzisz jakis blad w moim wyrazeniu?

Liczba odpowiedzi na stronę

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.