Krzaczki po ściągnięciu strony HTML

Krzaczki po ściągnięciu strony HTML
0

Ściągam stronę, w której mamy: <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
więc kodowanie znamy. UTF-8 jest domyślne dla Javy więc bez problemu powinniśmy to wyświetlić jednak zamiast np. przybliżony dostajemy w programie przybliĹĽony itd.

Trochę poszperałam i znalazłam np. coś takiego:
String newString = new String(oldString.getBytes("UTF-8"), "UTF-8"));
Jednak efekt dokładnie taki sam, nie wiem po co, ale też kombinowałam zmieniając na cp1250, ISO-8859-2 i nic z tego, co najwyżej inne krzaczki dostaję.

Dziwi mnie, że strona w UTF-8, nie może zostać od razu poprawnie odczytana w programie. Ma ktoś pomysł co trzeba zrobić?

Znalazłam też: http://4programmers.net/Forum/Java/164165-String_z_CP1250_do_Javy Ale nie pomogło, bo też trochę innego kodowania dotyczył wątek.

Proszę o pomoc, z góry dzięki.

Antoniossss
domyślne dla javy jest UTF-16
0

Ok, poradziłam sobie.
Wątek do usunięcia. Szkoda że konta wcześniej nie założyłam to mogłabym sama chyba to usunąć?

UT
Skoro poradziłaś sobie z tym to podaj rozwiązanie, aby ktoś inny nie zakładał tematu o to samo.
Sarrus
  • Rejestracja:prawie 14 lat
  • Ostatnio:7 dni
  • Postów:2512
0

Tutaj się wątków nie usuwa - ale można za to edytować posty ;)

Antoniossss
  • Rejestracja:prawie 16 lat
  • Ostatnio:ponad 10 lat
0

Bez sensu. Po prostu autor pobierał dane ze strony najprawdopodobniej jako windows-1250 (ale na 100% nie jako utf-8) a później takie śmieci konwertował na utf-8 i zadziwiony był, że nie działa.
Wszystko działało BO cyt: "efekt był taki sam" a więc znaki się nie pozmieniały przy konwersji:)


www.toptraker.pl
TopTraker! - I wiesz co jest grane!
Mój własny projekt w Javie - najnowsza wersja już jest!

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.