Chciałbym się nauczyć wykorzystywać w Pythonie pliki XML (na użytek aplikacji desktopowych i webowych). Czy lepiej postawić na biblioteki standardowe pythona, czy jakieś zewnętrzne, jak np. LXML lub inne? Co polecacie? Co warto poznać?
XML w pythonie - wbudowany? LXML? czy coś innego?
- Rejestracja: dni
- Ostatnio: dni
Ten podstawowy bardzo ogranicza ale na początek starczy. Co do tego LXML to go nie używałem ale zakładam, że działa podobnie, ponadto lepiej za bardzo nie polegaj na XML, ponieważ jest WOLNY.
- Rejestracja: dni
- Ostatnio: dni
- Lokalizacja: Wrocław
- Postów: 292
Możesz użyć BeautifulSoup. Przydaje się do parsowania tego typu rzeczy, to dojrzała biblioteka.
- Rejestracja: dni
- Ostatnio: dni
- Lokalizacja: Kraków
- Postów: 14
W pracy najczęściej spotkasz się z lxml, ponieważ jest najwydajniejszy, a przy mieleniu dużej ilości dokumentów tylko to się liczy. Minusem lxml są jego zależności, ponieważ nie był pisany w czystym pythonie. Natomiast BeautifulSoup z natury wolny, ale jeśli masz zainstalowany lxml to jest w stanie to wykryć i wykorzystać na Twoją korzyść.
Przy okazji polecam zerknąć na prezentację *PyCon PL 2013 "Python w służbie jej królewskiej mości"[*0], która opisuje wady i zalety najpopularniejszych parserów html.
[0] -
- Rejestracja: dni
- Ostatnio: dni
merlinnot napisał(a):
Możesz użyć BeautifulSoup. Przydaje się do parsowania tego typu rzeczy, to dojrzała biblioteka.
Ale to raczej służy głównie czy tylko do HTML, a nie XML?
- Rejestracja: dni
- Ostatnio: dni
- Lokalizacja: Wrocław
- Postów: 292
Wybitny Samiec napisał(a):
Ale to raczej służy głównie czy tylko do HTML, a nie XML?
"Beautiful Soup is a Python library for pulling data out of HTML and XML files."
- Rejestracja: dni
- Ostatnio: dni
Beautiful Soup is a Python library for pulling data out of HTML and XML files.