Cześć,
Napisałem sobie parser do danych z tej strony: http://www.gpw.pl/akcje_i_pda_notowania_ciagle_pelna_wersja#all. Niestety danę muszę przetworzyć np. przecinki w liczbach zmienić na kropki (tu zamiana działa bez problemu). Problem pojawia się z kolumną "Wol. obr. - skumul." Jak widać na stronie tysiące są oddzialane spacjami (chyba).
Tutaj mój kod:
URLConnection urlConnection = null;
URL url = new URL("http://www.gpw.pl/ajaxindex.php?action=GPWQuotations&start=showTable&tab=all&lang=PL&full=1");
urlConnection = url.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));
for (int i = 0; i < 7; i++) {
in.readLine();
}
String html = in.readLine();
Document doc = Jsoup.parse(html);
Elements links = doc.select("tr");
for (int i = 2; i < links.size()-1; i++) {
if (i % 22 == 0) {
i++;
continue;
}
Elements select = links.get(i).select("td");
System.out.print("open price: " + select.get(8).text());
System.out.print(" max price: " + select.get(9).text());
System.out.print(" min price: " + select.get(10).text());
System.out.print(" close price: " + select.get(11).text().replaceAll(",", "."));
System.out.println(" volume price: " + select.get(21).text().replaceAll("//s+", ""));
Do tej pory próbowałem replaceAll("*s+", ""), replaceAll("*s", ""), replaceAll("//W", "").