SPOJ Zliczanie wystąpień (kody ASCII)

Suchy702

2020-07-20T14:50:59+02:00

Rejestracja: dni
Ostatnio: dni
Postów: 363

Robię to zadanie na SPOJ, na wejściu dostaje ciąg znaków ASCII, mam wypisać nr ASCII i ilość wystąpień tego numery w posortowanej kolejności (biorąc pod uwagę znak ASCII), wszystko wydaje się okej ale w gdy na wejściu są polskie litery np. ę to otrzymuje inny kod ASCII niż w odpowiedziach na SPOJu ktoś pomoże mi zrozumieć dlaczego tak się dzieje?
Mój kod: https://ideone.com/OJcack

Bartłomiej Golenko

2020-07-20T15:00:05+02:00

Rejestracja: dni
Ostatnio: dni
Postów: 293

Masz inne kodowanie znaków ?

Kopiuj

(base) bartek@Inspiron-7720:~$ echo -n "ąćęłńóśźż" | iconv -f utf8 -t iso8859-2 | hd 
00000000  b1 e6 ea b3 f1 f3 b6 bc  bf                       |.........|
00000009
(base) bartek@Inspiron-7720:~$ echo -n "ąćęłńóśźż" | iconv -f utf8 -t cp1250 | hd 
00000000  b9 e6 ea b3 f1 f3 9c 9f  bf                       |.........|
00000009
(base) bartek@Inspiron-7720:~$ echo -n "ąćęłńóśźż" | hd 
00000000  c4 85 c4 87 c4 99 c5 82  c5 84 c3 b3 c5 9b c5 ba  |................|
00000010  c5 bc                                             |..|
00000012

Suchy702

2020-07-20T15:02:10+02:00

Rejestracja: dni
Ostatnio: dni
Postów: 363

Co powinienem zrobić?

stivens

2020-07-20T16:29:55+02:00

Rejestracja: dni
Ostatnio: dni

To jest zadanie na sortowanie przez zliczanie. Ladowanie tutaj slownika a potem sortowanie go to troche pomylka. Tracisz sens tych zadanek.

Suchy702

2020-07-20T17:27:13+02:00

Rejestracja: dni
Ostatnio: dni
Postów: 363

Zmieniłem kod na taki:
https://ideone.com/TSdoTH dostaję błędną odpowiedź, (tablica jest tak duża ponieważ gdy dawałem 256 lub 300 to dostawałem błąd NZEC teraz mam po prostu błędną odpowiedź) nie wiem w czym robię błąd

stivens

2020-07-20T17:32:42+02:00

Rejestracja: dni
Ostatnio: dni

Skup sie na drugim przykladzie.

Oczekiwane wyjscie:

Kopiuj

Twoj program daje:

Kopiuj

Co to za znaki?
https://theasciicode.com.ar/extended-ascii-code/box-drawings-single-horizontal-line-character-ascii-code-196.html

Poprobuj te konkretne znaki, ktore nie dzialaja debugowac

Suchy702

2020-07-20T17:40:38+02:00

Rejestracja: dni
Ostatnio: dni
Postów: 363

243 w moim programie to ó a te ze SPOJA to kompletnie nie wiem co

stivens

2020-07-20T17:41:28+02:00

Rejestracja: dni
Ostatnio: dni

Ogolnie to raczej ich wina, ze takich znakow uzywaja... Idz na https://leetcode.com/ i na trac czasu na ten serwis

tsz

2020-07-20T20:26:16+02:00

Rejestracja: dni
Ostatnio: dni
Postów: 394

O, panie...

To co masz w swoim rozwiązaniu to kody znaków Unicode. Tak ma być, jak ktoś współcześnie pracuje z tekstem to w 90% przypadków chce Unicode.

Taka litera "ę" jest kodowana w UTF-8 jako dwa bajty, "0xc4 0x99". Jak sobie przeliczysz to na liczby dziesiętne to się pokrywa z tym, co masz w przykładzie.

Szybkie wyszukanie jak wczytać same bajty w Pythonie zwraca takie coś https://stackoverflow.com/questions/32282448/read-stdin-as-binary

Generalnie to i treść zadania i testy są kijowe, bo sugerują, że dostaniesz znaki ASCII, które z definicji nie mogą przekraczać wartości 127. A w praktyce masz input UTF-8, który powinieneś potraktować jak ciąg bajtów.

Żeby było śmieszniej to naiwne rozwiązanie napisane w C++ by przeszło, bo tam domyślnie kodowanie nie jest brane pod uwagę. Zadanie jest z 2007 roku, więc pewnie autor nie ogarnął, że istnieją bardziej złożone kodowania. UTF-8 to wtedy jeszcze nie był tak powszechnie używany.

Liczba odpowiedzi na stronę

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.

Utwórz konto