Jak wyświetlić kod strony www

Jak wyświetlić kod strony www
SK
  • Rejestracja: dni
  • Ostatnio: dni
0

Jak najłatwiej przechwycić kod strony www i władować go do jakiegoś stringa? Nie chodzi mi o zrobienie przeglądarki. Program ma robić coś takiego:
Wpisuję jakiś adres, wciskam ENTER i wyświetla mi się cały kod strony www.

Bardzo prosty, ale nie mam pojęcia jak go napisać. :(
Ps. Mam dostęp do Visual C++ i Visual .NET

marcinEc
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 403
0
  1. Po co ci to?
  2. Wcale nie takie proste... Przeczytaj RFC na temat HTTP :>
  3. Jest takie narzędzie jak curl, np.

curl www.wp.pl
i masz stronę.

  1. Są biblioteki: libcurl, DataReel, itd.
  2. Pod Windows jest WinInet...
vixen03
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 475
0

zakladam, ze potrafisz juz uzywac socketow. teraz wiec wystarczy wyslac:

'GET /### HTTP/1.1\r\nHost: /$$$\r\nUser-Agent: /%%%\r\n\r\n'

'/###' sciezke do dokumentu
'/$$$' adres internetowy
'/%%%' nazwa programu, ktory sie laczy (nieobowiazkowe)

czyli np.
'GET /index.php HTTP/1.1\r\nHost: www.4programmers.net\r\nUser-Agent: mojaprzegladarka \r\n\r\n

SK
  • Rejestracja: dni
  • Ostatnio: dni
0

Niestety na programowaniu sieciowym nie znam się w ogóle. :| Umiem zrzucić do pliku kod strony www pod Linuksem, chyba trochę na około bo przez polecenie system(), w którym wprowadzam linijkę: "GET www.stronka.pl / HTTP / 1.1 > plik"
Ostatecznie tak to rozwiążę, ale wolałbym zrobić to na Windowsie, bo nie mam u siebie Linuksa i żeby na nim pisać muszę łączyć się z uczelnią, a to nie jest wygodne.

Ps. Program jest po to, żeby łatwiej mi było napisać program troche trudniejszy :) Mam kilkaset adresów stron i chcę je posortować według pewnego kryterium, które znajduje się w ich kodzie. Jak będę umiał wczytać kod HTML każdej z nich to chyba sobie poradzę.
Ps2. Z socketów w programowaniu kokoRZystaćystać nie umiem [sciana]

marcinEc
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 403
0
skrzypol napisał(a)

Niestety na programowaniu sieciowym nie znam się w ogóle. :| Umiem zrzucić do pliku kod strony www pod Linuksem, chyba trochę na około bo przez polecenie system(), w którym wprowadzam linijkę: "GET www.stronka.pl / HTTP / 1.1 > plik"
Ostatecznie tak to rozwiążę, ale wolałbym zrobić to na Windowsie, bo nie mam u siebie Linuksa i żeby na nim pisać muszę łączyć się z uczelnią, a to nie jest wygodne.

To ściągnić curl-a dla Windowsa http://curl.haxx.se/download.html
wrzuć curl.exe do katalogu ze swoim programem (czy gdzieś na PATH) i daj w kodzie:

Kopiuj
system("curl ADRES -o PLIK");

i w pliku PLIK masz źródło strony, będziesz miał takie samo rozwiązanie jak zrobiłeś na Linuxie (btw. curl dla Linuxa też jest...).

No a jeżeli czujesz się na siłach to biblioteki libcurl, albo DataReel.

SA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 513
0

najprościej:

Kopiuj
URLDownloadToFile(0, "http://4programmers.net/Forum/viewtopic.php?id=75482", "c:\\topic 75482.htm", 0,0)

urlmon.lib

SK
  • Rejestracja: dni
  • Ostatnio: dni
0

Dzięki, obydwa sposoby działają [browar]

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.