parsowanie html c# :: 4programmers.net

Porossss

2017-10-29 08:44

Porossss2017-10-29 08:44

załączone biblioteki

Kopiuj

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Net;
using System.IO;
using System.Threading.Tasks;
using System.Windows.Forms;
using HtmlAgilityPack;

Kod

Kopiuj

 label1.Text = "1 USD";
                List<string> kursy = new List<string>();

                WebClient web = new WebClient();
                string html = web.DownloadString("http://kursy-walut.mybank.pl/");
                MatchCollection m1 = Regex.Matches(html, @"<td id=\"GBPPLN_NBP\">\\s*(.+?)\\s*</td>", RegexOptions.Singleline);
                foreach (Match m in m1)
                {
                    if (m.Groups[1].Value != "")
                        {
                        string kurs = m.Groups[1].Value;
                        kursy.Add(kurs);
                    }
                }
                listBox1.DataSource = kursy;

ktoś wie dlaczego linijka

Kopiuj

 MatchCollection m1 = Regex.Matches(html, @"<td id=\"GBPPLN_NBP\">\\s*(.+?)\\s*</td>", RegexOptions.Singleline);

wywala błąd:
Syntax error, ';' expected
The name 'GBPPLN_NBP' does not exist in the current context
Cannot resolve symbol 'GBPPLN_NBP'

spartanPAGE 2017-10-29 12:36

zawsze czuję w sercu kłucie gdy widzę, jak ktoś musi parsować html...

kzkzg

2017-10-29 09:06

kzkzg2017-10-29 09:06

Rejestracja:ponad 8 lat
Ostatnio:około 11 godzin
Postów:926

Widzę że korzystasz z HTMLAgilityPack, więc strzelam że nie potrzebujesz zadnego regexa.
Spróbuj tak:
Odpalasz strone w chrome, klikasz prawym element ktory chcesz sparsowac, klikasz "zbadaj". W oknie po prawej klikasz prawym element ktory sie zaznaczyl i dajesz copy ->copy XPath .

Potem w kodzie robisz tak:

Kopiuj

     var html = @"http://kursy-walut.mybank.pl/";

     HtmlWeb web = new HtmlWeb();
     var htmlDoc = web.Load(html);

     string tresc = htmlDoc.DocumentNode.SelectSingleNode(" /*tutaj wklejasz co skopiowales z chrome */").InnerText;

Mozna tez to zrobic bez kopiowania XPath(czasami zawodzi), stosujac LINQ. Poczytaj o HTMLAgilityPack, ma naprawde spore mozliwosci

edytowany 1x, ostatnio: kzkzg 2017-10-29 12:48

Porossss

2017-10-29 10:05

Porossss2017-10-29 10:05

kopiuje się coś takiego

//*[@id="article"]/table/tbody/tr/td/center/table[1]/tbody/tr[2]/td[3]

po wstawieniu tego tam gdzie mówiłeś

Kopiuj

htmlDoc.DocumentNode.SelectSingleNode("//*[@id="article"]/table/tbody/tr/td/center/table[1]/tbody/tr[2]/td[3]").InnerText;

oczywiście:

The name 'article' does not exist in the current context

kzkzg

2017-10-29 11:24

kzkzg2017-10-29 11:24

Rejestracja:ponad 8 lat
Ostatnio:około 11 godzin
Postów:926

Chyba zle skopiowales Xpath, poza tym musisz pamietac zeby powstawiać \ przed podwojnymi apostrofami.

Kopiuj

 string tresc = htmlDoc.DocumentNode.SelectSingleNode("//*[@id=\"GBPPLN_NBP\"]").InnerText;

wynik: 4,7856

Porossss

2017-10-29 12:18

Porossss2017-10-29 12:18

Poszło!
Dzięki wielkie

Liczba odpowiedzi na stronę

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.

Utwórz konto

parsowanie html c#

Porossss

kzkzg

Porossss

kzkzg

Porossss

Programista Systemów Automatyki - PCS7

React Frontend Developer

PHP + Codeigniter 4 programista, aplikacja do fakturowania

DevOps Engineer - migracja serwerów (Kubernetes,Docker,RoR)

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami