Jak pobrac odpowiedni element z pliku html?

Jak pobrac odpowiedni element z pliku html?
poniatowski
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 1666
0

Witam,

Musze pobrac strone przez curl, a nastepnie sparsowac, azeby zapisac do bazy danych tylko odpowiednie elementy strony.
Uklad strony w html wyglada tak:
1ca4265ee7.png

Jak mam pobrac kontent z zaznaczonego diva? Jakies pomysly?

GU
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Wroclaw
  • Postów: 172
0

Użyłbym tego: http://symfony.com/doc/current/components/dom_crawler.html

Szukasz elementu po id, potem z tego elementu pobierasz 4 dziecko i masz.

Tumeg
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 687
1

W PHP natomiast jest sobie: http://php.net/manual/en/book.dom.php

poniatowski
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 1666
0

KOSZ!

poniatowski
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 1666
0

Ok. Ja zacząłem bawić się od klasy domdocument i udało mi się pobrać całego diava, ale problem był w rozpoznaniu h1, h2 i oddzieleniu kontentu, pomiędzy nimi. Więc wywaliłem tą klasę i jeszcze inną jaką używałem i zastosowałem wyrażenia regularne z preg_match i gdzieś tam pomiędzy użyłem str_replace, do wywalenia niepotrzebnych tagów, ew. dodania idka, a następnie znowu użycia wyrażenia regularnego. I wszystko zajęło mi chwilę, z domdocument klasą i jeszcze jąkąś tam coś jak DomPath czy jakoś siedziałem i czytałem dokumentacje z 2-3h, niby byłem blisko, ale prostasprawa zabrała mi 2-3 razy więcej czasu niż powinna. Druga sprawa, jest taka, że może czas najwyższy podszkolić się z tej klasy :)

edit:
Gdzieś tam w między czasie pobrałem Simply HTML parser klasę i też dupa z niej wyszła...

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.