Błąd z Non-UTF-8

Błąd z Non-UTF-8
KD
  • Rejestracja:ponad 4 lata
  • Ostatnio:ponad 4 lata
  • Postów:53
0

SyntaxError: Non-UTF-8 code starting with '\xb9' in file C:\Users\Maciej\PycharmProjects\Testowanie\Nowy_Scraping.py on line 34, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

Błąd pojawia się gdy dodam do kodu i to tylko w tym pliku :( Nie wiem co zrobiłem źle, ale raczej pojawiło się w trakcie.

Kopiuj
print('ążć')

Niech wiek nie ogranicza chęci poszerzenia horyzontów!
  • Rejestracja:około 6 lat
  • Ostatnio:ponad rok
0

Tak.

KD
  • Rejestracja:ponad 4 lata
  • Ostatnio:ponad 4 lata
  • Postów:53
0

@Mózg: Czemu pojawia się problem i jak go rozwiązać? Komunikat o błędzie odsyła do http://python.org/dev/peps/pep-0263/ Nie wiem dokładanie co mam zrobić aby pomogło.


Niech wiek nie ogranicza chęci poszerzenia horyzontów!
Althorion
Moderator C/C++
  • Rejestracja:prawie 10 lat
  • Ostatnio:dzień
  • Postów:1607
1

Upewnij się, że twój kod źródłowy ma poprawne kodowanie UTF-8 — bo ten błąd wyraźnie wskazuje na to, że ma CP-1250 (\xb9 to ą).

KD
  • Rejestracja:ponad 4 lata
  • Ostatnio:ponad 4 lata
  • Postów:53
0

@Althorion: Pracuję na PyCharm, raczej nie zmieniałem żadnych ustawień które przyczyniły by się do pojawienia się tego problemu:(
Chyba że może jakimś skrótem klawiszowym nieświadomie.

Poszperam w konfiguracji. -> Pomogło :D

Bardzo dziękuję za wskazanie kierunku do rozwiązania problemu.


Niech wiek nie ogranicza chęci poszerzenia horyzontów!
KD
  • Rejestracja:ponad 4 lata
  • Ostatnio:ponad 4 lata
  • Postów:53
0

Dobry,

Kontynuując nieszczęsny wątek kodowania, wpadłem znowu w kłopot.
Pobieram stronę www z encoding='utf-8', BeautifulSoup też utf8. Zapisuje potem dane do pliku csv, już bez utf-8 bo to ustawie to pojawiają się inne znaki. Wszystko działa aż napotkam na 1800 g/m² (tak zakładam) i wszystko się sypie. Ta 2 to nie indeks górny <sup> :( i zakładam że przez to mam ten błąd:
UnicodeEncodeError: 'charmap' codec can't encode character '\xb2' in position 347: character maps to <undefined>

Jak poradzić sobie z takim fantem?

Robię coś takiego: pobrana_Strona = pobrana_Strona.encode('utf-8', 'ignore') i nie pomaga :(

Ale pomogło dodanie errors='ignore' przy otwieraniu pliku

Kopiuj
csv_file = open('NOWY.csv', mode='w', newline='', errors='ignore')

Dumny jestem :D


Niech wiek nie ogranicza chęci poszerzenia horyzontów!
edytowany 3x, ostatnio: KaDwa
Shalom
  • Rejestracja:ponad 21 lat
  • Ostatnio:około 3 lata
  • Lokalizacja:Space: the final frontier
  • Postów:26433
0

A jaki encoding faktycznie ma strona którą pobierasz? :) Bo wiesz, napisanie że yolo, łykaj jako utf-8 nie rozwiązuje problemu żadnego, jeśli faktyczna strona korzysta z jakiegoś dziwnego kodowania które z utf nie jest kompatybilne. Zresztą pytanie też co chcesz z tym potem zrobić?


"Nie brookliński most, ale przemienić w jasny, nowy dzień najsmutniejszą noc - to jest dopiero coś!"

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.