Wyrażenie regularne - nie mam pomysłu

Wyrażenie regularne - nie mam pomysłu
  • Rejestracja: dni
  • Ostatnio: dni
0

Cześć.
Pisze w C# i .NET.
Oto tekst, z którego chcę wyskrobać tytuł, kategorię, która się zmienia oraz wyraz po kategorii (w tym przypadku "jakis_tekst-345345"):
<quote><a href="http://strona.com/kategoria/jakis_tekst-345345" title="Jakis_Tytul" rel</quote>

Próbowałem już:

Kopiuj
MatchCollection matchCol = Regex.Matches(tekst, "^<a href=\"http://strona.com/([a-z]*)/(.*)\" title=\"(.*)\" rel$");

No, nie działa...

Proszę o pomoc. Dzięki za wszelką pomoc.

H4
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 107
0

Hmm kiedyś się tak bawiłem, to spisywałem dokument do tablicy, po czym obcinałem nieco string'a

Może są jakieś gotowe funkcje pod HTML'a

CK
  • Rejestracja: dni
  • Ostatnio: dni
0

Zamiast stosować wyrażenia regularne użyj parsera pod html[0]. Odwołujesz się pod href atrybut i ucinasz kawałek stringa od linku stosując funkcje rodzaju last_index_of i substring.

[0] - http://stackoverflow.com/questions/56107/what-is-the-best-way-to-parse-html-in-c

By the way - Jeśli tworzony program jest czymś w rodzaju lekkiego bota to na twoim miejscu rozważyłbym możliwość użycia języków skryptowych. Mniej sił w to wkładasz i do tego czerpiesz więcej radości z osiąganych rezultatów. Mówię tu szczególnie o przypadku przetwarzania tekstów.

  • Rejestracja: dni
  • Ostatnio: dni
0

Użyłem leniwą wersję kwantyfikatora, nieco poprawiłem wyrażenie i działa :). Bez leniwca nie działa.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.