Krzaki, czyli unicode w pythonie 3

Krzaki, czyli unicode w pythonie 3
0

Ściągam dane ze strony, która deklaruje że jej kod jest w utf-8. Tekst ze strony jest OK. Tylko wybrane liczby (konkretnie ceny produktów) są w postaci 3? 454,00 z? zamiast 3 454,00 zł.

Nie bardzo wiem, jak sobie z tym poradzić.

Używając encode/ decode nic nie pomogło. Kod tego niepożądanego znaku to \xa0 (ZTCP).

Używam Pythona 3.4

Co poradzicie?

0

Jeszcze dodam:

  • próbowałem z

nz = nazwa_zmiennej.replace("\xa0", " ")
(nazwa_zmiennej to string)

Jak pozbyć się znaków innych niż alfanumeryczne?

strip, rstrip i lstrip usuwają tylko "białe znaki" z tego co próbowałem, i tylko z końców stringa.

Shalom
  • Rejestracja:około 21 lat
  • Ostatnio:około 3 lata
  • Lokalizacja:Space: the final frontier
  • Postów:26433
0

Możesz zrobić:

Kopiuj
fixed = unicodedata.normalize("NFKD", line)
fixed = fixed.encode('ascii', 'ignore')

"Nie brookliński most, ale przemienić w jasny, nowy dzień najsmutniejszą noc - to jest dopiero coś!"

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.