Wiele kodowań tekstu w jednym pliku csv

Wiele kodowań tekstu w jednym pliku csv
0

Witam, mam następujący problem,
Dane do pliku csv były czerpane z różnych źródeł, w efekcie plik składa się z fragmentów tekstów zakodowanych różnorako. Nie wiem jakich kodowań plik może używać i w których miejscach sie zmieniają. Czy jest sposób tak napisać program by przetworzył plik na 1 ustalone kodowanie z poprawnie zapisanym tekstem, jeśli tak to w jaki sposób.

Pozdrawiam

Patryk27
Moderator
  • Rejestracja:prawie 18 lat
  • Ostatnio:prawie 2 lata
  • Lokalizacja:Wrocław
  • Postów:13042
0

Jaki język? Polski?


aurel
A co to za różnica? ;)
aurel
Moderator
  • Rejestracja:około 15 lat
  • Ostatnio:3 minuty
0

Da się, ale potrzebna ci będzie m.in. wiedza, jakie kodowania zostały użyte.
IMHO należałoby zacząć od wykrycia, z jakim kodowaniem w tej danej linii mamy do czynienia
http://stackoverflow.com/questions/1025332/determine-a-strings-encoding-in-c-sharp
http://www.codeproject.com/Articles/17201/Detect-Encoding-for-In-and-Outgoing-Text
http://stackoverflow.com/questions/4520184/how-to-detect-the-character-encoding-of-a-text-file

A następnie konwertować z tego co ustaliliśmy, na to co chcemy.

edytowany 1x, ostatnio: aurel

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.