Jakiego języka się teraz nauczyć ?

0

OK, tego R to już nawet nieźle umiem. Czego uczyć się dalej , żeby pracować w przyszłości przy przetwarzaniu danych?

2

Jak praca jako data scientist, to zdecydowanie Python.

0
//JAVA
public class aq{
 public static void main(String[]args){
for (int i=1; i<200001;i++){
        System.out.println(i);}
}
}
 #R
for(i in 1:200000){
  cat(paste(i,"\n"))
}
5

A na przykład

		StringBuilder sb = new StringBuilder();
		for (int i=1; i<200001;i++){
			sb.append(i);
			sb.append("\n");
		}
		System.out.println(sb.toString());

? ;]

1

A takie:

        String x = IntStream.range(1, 200001).boxed().map(Object::toString).collect(Collectors.joining("\n"));
        System.out.println(x);

? :)

0

cat(c(1:200000),sep='\n'))
7,4 sek.

0

Pewnie wąskim gardłem stała się sama konsola i poniżej 7 sek nic nie zejdzie. Spróbuj wypisywania do pliku.

0

write.csv(1:200000,"abcc.csv")
0,48 sek., ale nie do końca to było celem, bo chciałem, żeby na ekran wypisywało ;p

4

Kup szybszy ekran.
</sarkazm>

Jeśli testujesz wydajność w taki sposób, że testowany kod nie jest wąskim gardłem, to w zasadzie nic nie testujesz. Optymalizacje tutaj podane nie pokazują szybkości wykonywania kodu w Javie/ Pythonie/ R/ etc tylko skuteczności obchodzenia narzutu wywołania funkcji systemowych.

2
Wibowit napisał(a):

Pewnie wąskim gardłem stała się sama konsola i poniżej 7 sek nic nie zejdzie. Spróbuj wypisywania do pliku.

Spróbuj zapisu do RAM-u. Operacje zapisu na dysk też mogą być wąskim gardłem. ;-)

0

Wracając do tematu, jeśli chcesz robić w BigData, to na topie są Java (Hadoop) i Scala (Spark). Przy czym język to pikuś jest, tu trzeba rozumieć trochę więcej co się robi, jak działa sprzęt, jak działa silnik bazy danych, jak efektywnie używać RAMu itp. Bez tego to można się wpakować nie w 32-krotne spowolnienie a 3200-krotne.

0

Tylko R, wiadomo @Laflx :| Keep Calm and make a better world with R <--- Taki plakat nawet sobie zamówiłem :)