4programmers.net works best with JavaScript enabled!

kodowanie polskich znaków

Witam, wysyłam na serwer polskie znaki, jednak są widziane w stringu jako śmieć. Poniżej kawałek kodu gdzie pobieram bajt i zapisuje do stringa

 String    s = System.Text.Encoding.UTF8.GetString(b);

Wysyłam np. litere ł - kod w UTF8 to c5, w bajcie poprawnie widzę wartość c5 jednakże do stringa nie przypisuje się litera ł tylko śmieć. W czym może być problem ??

no ale czym jest b?

No i gdzie wyświetlasz to s?

b jest tablicą bajtów 1 znakową, czytam znak po znkau

 byte[] b=new byte[1]

a s to string, podglądam go na debugerze i widze krzaki a wyświetlam w richTextBox

Hmm a mi się coś wydawało że UTF-8 jest kodowane na dwóch bajtach

http://www.utf8-chartable.de/unicode-utf8-table.pl?start=256
U+0142 ł c5 82 LATIN SMALL LETTER L WITH STROKE

UTF-8 jest kodowaniem o zmiennej długości, od 1 do 4 bajtów na znak.

Liczba odpowiedzi na stronę

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.

Utwórz konto

351 użytkowników online

aurel
Moderator

MarekR22
Moderator C/C++

flowCRANE
Moderator Delphi/Pascal

Riddle
Moderator Inżynieria oprog.

pradoslaw
Administrator

+41

+298 niezalogowanych online

Aktualnie na tej stronie

+1 niezalogowany online

Popularne tagi

c++× 21799
java× 16628
c#× 16315
php× 7703
c× 7589
javascript× 6044
delphi× 5440
sql× 3827
python× 3269
mysql× 3008

kodowanie polskich znaków

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami