tablica.pl parsowanie curlem

tablica.pl parsowanie curlem
T0
  • Rejestracja:ponad 12 lat
  • Ostatnio:ponad 2 lata
  • Postów:40
0

Witam, chce pobrac curlem telefon z oferty tablica.pl (normalnie to ajax/json) , niby mam adres proboje odtworzyc naglowki ale zwraca mi komunikat ze przekroczylem limity. cos pewnie robie nie tegas. moze jakas podpowiedź wasza?

np ogłoszenie :
http://tablica.pl/oferta/dom-gospodarstwo-w-zalinie-CID3-ID3ekrr.html
zapytanie ajaxowe
http://tablica.pl/ajax/misc/contact/phone/3ekrr/

i w odpowiedzi dostaje : "{"error":1,"value":"Limit zosta\u0142 przekroczony. Spr\u00f3buj ponownie za godzin\u0119."}"

a jak dodam w naglowku gzip, to otrzymuje krzaki :
��K@0ЫLf-��p;[���>�f(1��ؾ��h���Tz K��jw�v݄D�)x33uB��y2dm�����Y�a�^���*b|^�5�v\

Kopiuj
 $ch = curl_init();
        $headers=array(
            "Host: tablica.pl",
            "Connection: keep-alive",
            "X-Requested-With: XMLHttpRequest",
            "Accept-Encoding: gzip,deflate,sdch",
            "Cookie: xtvrn=$507462$; cookieBarSeen=true; last_locations=1079-0-0-Bia%C5%82ystok-podlaskie; PHPSESSID=9oph1cp11fnk1951i8cvag4cs2; __utma=180017569.1513611367.1395743951.1395815719.1395818355.6; __utmb=180017569.3.8.1395818429927; __utmc=180017569; __utmz=180017569.1395815719.5.3.utmcsr=tablica.yum.pl|utmccn=(referral)|utmcmd=referral|utmcct=/index.php",
            "Accept: application/json",
            ""
        );
    $agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5"; 
curl_setopt($ch, CURLOPT_HTTPHEADER, 
        array(
            'Accept-Encoding:gzip', 
            'Content-Type: application/x-json; charset=utf-8',
            'Connection: Keep-Alive',
            'Accept: */*',
            'Host: tablica.pl',
            'X-Requested-With: XMLHttpRequest',
            ''
            )
        ); 
curl_setopt($ch,CURLOPT_COOKIEFILE,"cookie.txt");
curl_setopt($ch,CURLOPT_COOKIEJAR,"cookie.txt");
#curl_setopt($ch, CURLOPT_ENCODING ,"GZIP");
curl_setopt($ch,CURLOPT_USERAGENT,$agent);
curl_setopt($ch,CURLOPT_HEADER, false);
curl_setopt($ch,CURLOPT_NOBODY ,false);
curl_setopt($ch,CURLOPT_RETURNTRANSFER ,true);
curl_setopt($ch, CURLOPT_REFERER, $referer);
curl_setopt($ch, CURLOPT_URL, $url);
      echo   $e=curl_exec($ch);
 
dzek69
Moderator
  • Rejestracja:ponad 18 lat
  • Ostatnio:30 dni
  • Lokalizacja:Rzeszów
0

ja dostaję

Kopiuj
{"value":"600 231 877"}

zapewne testując naładowałeś tysiące requestów i dostałeś bana.
daj sobie spokój na godzinę i powinno za godzinę działać.


T0
  • Rejestracja:ponad 12 lat
  • Ostatnio:ponad 2 lata
  • Postów:40
0

to nie to, klikając w ogłoszeniu w Pokaż (ajaxem pobierany jest telefon/javascript) i działa tyle razy ile chcę, no ale jak "niby" robie to curlem to juz mam error. podejrzewam ze źle to wykonuje curlem, albo nie uwzgledniam jakis zabezpieczen...

dzek69
Moderator
  • Rejestracja:ponad 18 lat
  • Ostatnio:30 dni
  • Lokalizacja:Rzeszów
1
Kopiuj
$url = "http://tablica.pl/ajax/misc/contact/phone/3ekrr/";
$ch = curl_init();
curl_setopt($ch, CURLOPT_HTTPHEADER,
    array(
        'User-Agent: Opera/9.80 (Windows NT 6.1; WOW64) Presto/2.12.388 Version/12.16'
    )
);
curl_setopt($ch,CURLOPT_COOKIEFILE,"cookie.txt");
curl_setopt($ch,CURLOPT_COOKIEJAR,"cookie.txt");
curl_setopt($ch,CURLOPT_HEADER, false);
curl_setopt($ch,CURLOPT_NOBODY ,false);
curl_setopt($ch,CURLOPT_RETURNTRANSFER ,true);
curl_setopt($ch, CURLOPT_REFERER, $referer);
curl_setopt($ch, CURLOPT_URL, $url);
   $e=curl_exec($ch);
var_dump($e);

T0
  • Rejestracja:ponad 12 lat
  • Ostatnio:ponad 2 lata
  • Postów:40
0

Pieknie !!!!! mistrzu złoty. dziekuję za pomoc

dzek69
pacnij "fajkę" przy poście
freemp3
  • Rejestracja:ponad 11 lat
  • Ostatnio:około 15 godzin
  • Lokalizacja:Miechów
  • Postów:284
0
te0dor napisał(a):

to nie to, klikając w ogłoszeniu w Pokaż (ajaxem pobierany jest telefon/javascript) i działa tyle razy ile chcę, no ale jak "niby" robie to curlem to juz mam error. podejrzewam ze źle to wykonuje curlem, albo nie uwzgledniam jakis zabezpieczen...

Oczywiście, że nie uwzględniasz. Serwis na bank sprawdza skąd przychodzą żądania i dla tych, które pochodzą ze strony puszcza bez problemu, a dla zewnętrznych stosuje ograniczenia.
Swoją drogą w jakim celu chcesz wyciągać numery telefonów?


T0
  • Rejestracja:ponad 12 lat
  • Ostatnio:ponad 2 lata
  • Postów:40
0

a jednak nadal nie do końca zadowalające rozwiązanie :/ po pobraniu około 10 telefonow nastepuje blokada na jakiś czas

dzek69
Moderator
  • Rejestracja:ponad 18 lat
  • Ostatnio:30 dni
  • Lokalizacja:Rzeszów
0

bo to nie jest żadne API, ty po części abusujesz ich system takimi requestami, więc Cię blokują. i tak post jest na tyle podejrzany, że powinien skończyć w koszu, na porady dot. możliwych blokad i sposobów ich omijania nie licz.
a najlepiej napisz do tablica.pl o udostępnienie jakiegoś API.


0

tablica.pl nie posiada żadnego API ani nie udostępni możliwości pobierań numerów tel. Po wyciągnięciu paru telefonów dostajesz bana i to nawet nie chodzi o wyciąganie telefonów po prostu jak z automatu wykonujesz zbyt dużo połączeń w zbyt krótkim czasie wyłapujesz automatycznie bana.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.