Python czytanie plików o innych formatach niż txt

Python czytanie plików o innych formatach niż txt
NA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 21
0

Tak jak w temacie, jak mam taki kod

Kopiuj
file = 'text.doc'

try:
    f = open(file, 'r')
except IOError:
    print ('Błąd pliku')


print(f)
str = f.read()
print (str)

f.close()

to wyskakuje mi błąd kodowania
Pozdrawiam

Patryk27
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Wrocław
  • Postów: 13042
0

Co chcesz osiągnąć?
Aby przeczytać tekst z pliku doc musiałbyś użyć jakiegoś parsera.

NA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 21
0

Czym jest praser? Swoja drogą chciałbym stworzyć małą bazę danych opartą o excela.

Patryk27
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Wrocław
  • Postów: 13042
0

Parser, a nie praser.

NA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 21
0

Zapodał byś mi jakiś przykład np. operacji na pliku z ms word czy libre office ?

NA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 21
0

dziękuję

NA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 21
0

Jest jeszcze jedno ogarnia ktoś bibloteke pythona pyparser? Czy ona pozwoli pisać programy bazodanowe oparte np. o openoffice?

xfin
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Genewa
  • Postów: 597
1

Nie lepiej byłoby Ci użyć zwykłej bazy danych, a później dorobić możliwość eksportu do dokumentu excela? Baza oparta na plikach dowolnego programu officowego to zły pomysł. Masa czasu będzie marnowana na odpowiedni ich zapis i uaktualnienia.

Wizzie
  • Rejestracja: dni
  • Ostatnio: dni
1

Pyparser kompletnie nie do tego służy, to biblioteka do tworzenia prostych gramatyk różnych języków/formatów.

Jeżeli chcesz pracować na plikami .doc w Pythonie, użyj bliblioteki, np: https://python-docx.readthedocs.org/en/latest/
Pytałeś o współpracę z OpenOffice - ma ono swoje API i implementację w Pythonie, w dodatku OpenOffice ma wbudowanego Pythona, ale jak chcesz opierać bazę danych na dokumentach worda czy openoffice to tak jak mówił @xfin, wybij to sobie z głowy ;) Dodam tylko, że jeśli to nie są jakieś ustrukturyzowane dane (typu właśnie długi tekst, maile itd) to wręcz stworzone do tego są bazy document-oriented, np. MongoDB.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.