Wyrażenia regularne, import re

AdaKo

2019-09-15 17:41

AdaKo2019-09-15 17:41

Rejestracja:prawie 6 lat
Ostatnio:prawie 4 lata
Postów:38

Witam. Mam pewne zadanie, gdzie muszę z tekstu wyciągnąć inicjały i nazwiska odkrywców. Zrobiłem tyle i nie wiem czemu nic mi nie wyświetla:

planetoidy = '''(1) Ceres 2,7653 1 stycznia 1801 G. Piazzi
(2) Pallas 2,7722 28 marca 1802 H. W. Olbers
(3) Juno 2,6701 1 września 1804 K. Harding
(4) Westa 2,3619 29 marca 1807 H. W. Olbers
(5) Astraea 2,5771 8 grudnia 1845 K. L. Hencke
(6) Hebe 2,4256 1 lipca 1847 K. L. Hencke
(7) Iris 2,3856 13 sierpnia 1847 J. R. Hind'''

Kopiuj

 import re

for odkrywca in re.finditer(r'\[A-Z]\$',planetoidy):
    print(odkrywca.group()) ```

edytowany 1x, ostatnio: AdaKo 2019-09-15 17:42

Markuz

2019-09-15 17:52

Markuz2019-09-15 17:52

Rejestracja:prawie 17 lat
Ostatnio:17 dni
Postów:644

https://regex101.com/r/l62gFv/1

możesz się bawić na żywo, po prawej jest wszystko wyjaśnione, na dole po prawej masz docs.

edytowany 1x, ostatnio: Markuz 2019-09-15 17:55

AdaKo

2019-09-15 17:56

AdaKo2019-09-15 17:56

Rejestracja:prawie 6 lat
Ostatnio:prawie 4 lata
Postów:38

A jak mógłbym wywołać te pierwsze litery? Chodzi mi o te inicjały, jeśli [A-Z] nie działa to w jaki sposób?

AdaKo

2019-09-15 18:14

AdaKo2019-09-15 18:14

Rejestracja:prawie 6 lat
Ostatnio:prawie 4 lata
Postów:38

Mam coś takiego

Kopiuj

r'\w?[A-Z].\s.+'

Chyba nie jest najoptymalniejsza no ale jest XD

~~PerlMonk~~ 2019-09-15 19:01

Zapis .+ trochę razi, ale przynajmniej to już jakiś punkt wyjścia do dalszej pracy.

AdaKo

2019-09-15 20:30

AdaKo2019-09-15 20:30

Rejestracja:prawie 6 lat
Ostatnio:prawie 4 lata
Postów:38

Mam jeszcze takie pytanie. Jakbym chciał złączyć te dwie rzeczy np. Inicjały z nazwiskami i do tego te liczby 2,7.... itd. to jak mógłbym to zrobić?

(1) Ceres 2,7653 1 stycznia 1801 G. Piazzi ===> 2,7653 G. Piazzi

Chodzi mi o coś takiego

edytowany 1x, ostatnio: AdaKo 2019-09-15 20:31

AsterFV

2019-09-16 07:07

AsterFV2019-09-16 07:07

Rejestracja:prawie 7 lat
Ostatnio:10 dni
Postów:172

A tak na marginesie, czy to musi być koniecznie regex? Bo jeżeli masz tak powtarzalny format danych to spróbowałbym pomóc sobie Pythonem. Np. :

Kopiuj

for line in planetoidy:
   columns = line.split()
   return f'{columns[2]} {columns[6]} {columns[7]}'

Wtedy problem staje się trywialny.

A liczby w regexie możesz wyłapać tak:

Kopiuj

([0-9]+,?[0-9]*)

Żeby nie wyłapać też () możesz dodać spacje wokół albo zrobić look behind:

Kopiuj

 ([0-9]+,?[0-9]*)

Kopiuj

(?<=\([0-9]\))([0-9]+,?[0-9]*)

AdaKo

2019-09-16 08:53

AdaKo2019-09-16 08:53

Rejestracja:prawie 6 lat
Ostatnio:prawie 4 lata
Postów:38

Nie musi być tylko myslałem że mogę zrobić coś w stylu 'r( "jeden przykład" + "drugi przykład", blabla) no ale jak się tak nie da no to trudno. Dzięki wszystkim za pomoc :)