Zapis strony internetowej do pliku txt

0

Witam w jaki sposób zapisać strone np www.4programmers.net/
by zapis był identyczny z tym jak zapisujemy stronę w przeglądarce -- zapisz jako - plik tekstowy ??

bo zapis : - Daje jej "kod"

var
S: string;
IdHTTP: TIdHTTP;
begin
IdHTTP := TIdHTTP.Create(nil);
try
S := IdHTTP.Get('http:/www.4programmers.net');
memo1.Text:=s;
finally
IdHTTP.Free;
end;
end;

0

Nigdy nie zrobisz tego "tak samo" bo nigdy nie jest "tak samo". Każda przeglądarka implementuje to na swój sposób. Ma do tego cały mechanizm, sama ustala reguły.

Napisanie własnego mechanizmu nie będzie proste. Trzeba jakoś symulować layout!!! Czyli musiałbyś mieć w zasadzie cały silnik przeglądarki.

Jedyny pomysł jaki mi przychodzi do głowy to załadowanie strony do ukrytej kontrolki (np. ActiveX) jakiejś przeglądarki (IE/ mozilla). Ale i tak zaczynają się schody. Jak ją zmusić do zapisania strony w txt tak by było to niewidoczne dla użytkownika? Nie mam pomysłu...

0

Jak ją zmusić do zapisania strony w txt tak by było to niewidoczne dla użytkownika

Można kontrolkę umiejscowić gdzieś daleko poza formą.


Odnośnie pytania - możesz wyłuskiwać tekst spomiędzy znaczników, wtedy efekt będzie podobny. Np.jeżeli mamy stronę o kodzie: ```html <html> <head> <title>tytuł</title> </head> <body>

foo

</body> </html> ``` Należy najpierw wyłuskać tekst spomiędzy `<body>`...`</body>`, a potem spomiędzy znaczników `p`, `span`, `div` i tym podobnych. Taka okrojona wersja prostego silnika do przeglądania stron.
0

Odnośnie pytania - możesz wyłuskiwać tekst spomiędzy znaczników, wtedy efekt będzie podobny.

Bardzo, na pewno samemu się zrobi z <br> nowa linia.

Należy najpierw wyłuskać tekst spomiędzy <body>...</body>, a potem spomiędzy znaczników p, span, div i tym podobnych.
Taka okrojona wersja prostego silnika do przeglądania stron.

Piszmy silniki przeglądarek.

Ja mam inne pytanie: Po co ci to. Nie widzę praktycznego zastosowania, a pewnie newbi wymyślił kolejny genialny pomysł.

0
-123oho napisał(a)

Piszmy silniki przeglądarek.

Nie od razu pełne silniki, ale stworzenie najprostszego nie jest przecież niczym trudnym (po prostu obsługa podstaw samego HTML'a).
Nikt tutaj nie mówi o pisaniu kolejnego Explodera.

0
Patryk27 napisał(a):
-123oho napisał(a)

Piszmy silniki przeglądarek.

Nie od razu pełne silniki, ale stworzenie najprostszego nie jest niczym trudnym przecież (czyli po prostu obsługa podstaw samego HTML'a).

Tylko problem w tym że jeżeli napiszesz mizerny silnik to wynik będzie mizerny (albo jeszcze bardziej mizerny). Jeżeli uważasz że dzisiaj strony bazują na samym HTMLu to się mylisz... Już nie mówiąc że sam standard HTML też nie jest prosty. Twoje rozwiązanie będzie działać tylko w cieplarnianych warunkach. Nie widzę sensu pisania czegoś w czym nie osiągniesz prawie żadnego wyniku zwłaszcza że nie masz lat na rozwijanie tego.

0

jest proste rozwiązanie gotowiec - http://htmlp.sourceforge.net/
oryginalnie stworzony do zamieniania "html" w poczcie na plain text

0
szopenfx napisał(a):

jest proste rozwiązanie gotowiec - http://htmlp.sourceforge.net/
oryginalnie stworzony do zamieniania "html" w poczcie na plain text

Wielkie dzieki !!!

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.