Wiele kodowań tekstu w jednym pliku csv

Wiele kodowań tekstu w jednym pliku csv
  • Rejestracja: dni
  • Ostatnio: dni
0

Witam, mam następujący problem,
Dane do pliku csv były czerpane z różnych źródeł, w efekcie plik składa się z fragmentów tekstów zakodowanych różnorako. Nie wiem jakich kodowań plik może używać i w których miejscach sie zmieniają. Czy jest sposób tak napisać program by przetworzył plik na 1 ustalone kodowanie z poprawnie zapisanym tekstem, jeśli tak to w jaki sposób.

Pozdrawiam

Patryk27
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Wrocław
  • Postów: 13042
0

Jaki język? Polski?

aurel
  • Rejestracja: dni
  • Ostatnio: dni
0

Da się, ale potrzebna ci będzie m.in. wiedza, jakie kodowania zostały użyte.
IMHO należałoby zacząć od wykrycia, z jakim kodowaniem w tej danej linii mamy do czynienia
http://stackoverflow.com/questions/1025332/determine-a-strings-encoding-in-c-sharp
http://www.codeproject.com/Articles/17201/Detect-Encoding-for-In-and-Outgoing-Text
http://stackoverflow.com/questions/4520184/how-to-detect-the-character-encoding-of-a-text-file

A następnie konwertować z tego co ustaliliśmy, na to co chcemy.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.