Po co używać w ogóle R do data science? Jedyną zaletą R nad Pythonem jest pare tysięcy bibliotek do statystyki, matematyki, matematyki finansowej itp. Czy nie lepiej jest przepisać wszystko do Pythona? Czemu część data scientistów to takie młoty? Czemu popularność R rośnie w tempie takim jak popularność pythona, mimo że R to kompletne badziewie i jego jedyną zaletą są te nieszczęsne biblioteki, które rozwijali przez ostatnie 20 lat profesorkowie zapaleńcy statystyki i które są rzeczywiście dobre, ale czy to znaczy że do końca świata mamy tkwić w tym zaklętym kole? Na grupie Data Science PL na fb dużo jest R-owców. Opamiętajcie się ludzie. Musimy coś z tym zrobić. Jakąś kampanie popularyzacji Pythona w Polsce. Trzeba jakoś przekonać tych profesorków z pw,agh,sgh,mim uw itp. do pythona.
@Julian_ @Shalom
Zapraszam do dyskusji ;)
- Rejestracja:około 8 lat
- Ostatnio:prawie 6 lat
Siedze w R i pythonie od dwoch lat, pod katem data science. W R glownie z przymusu. Python jest pod kazdym wzgledem lepszy. Składnia, obiektowość, biblioteki do sieci neuronowych, text miningu itp. Ostatnio chciałem się pobawić deep reinforcement learningiem, w R nic nie jest zaimplementowane. R to dobry jezyk dla amatorów, statystyków, analityków. Ale jak ktoś chce iść w kierunku najbardziej nowoczesnych odnóg data science, to w R jest pustka. Python jest lepszy.

- Rejestracja:około 8 lat
- Ostatnio:ponad 4 lata
- Postów:1703
A wizualizowałeś coś kiedyś? R ora po całości wszystkie języki świata jeśli chodzi o wizualizację danych, pozwala na najpiękniejsze na świecie interaktywne wizualizacje. Do tego automatyzacja raportów i wsparcie reproductible research.
Jedyną prewagą Pythona nad Rem była szybkość - przy dużej ilości danych. Teraz kiedy narodziła się Julia, która jest nawet szybsz od Javy, Python już nie ma sensu.
- Rejestracja:około 8 lat
- Ostatnio:prawie 6 lat
This table shows that optimized Python code is faster than Julia for the first 6 examples, and slower for the last 2. Note that for Fibonacci I used the recursive code to be fair.


- Rejestracja:około 9 lat
- Ostatnio:ponad 6 lat
- Lokalizacja:Warszawa
- Postów:118
JacekJackiewicz napisał(a):
Po co używać w ogóle R do data science?
Odpowiedzią jest:
JacekJackiewicz napisał(a):
R to dobry jezyk dla amatorów, statystyków, analityków.
- Analityków i statystyków potrzeba coraz więcej, a R jest moim zdaniem łatwiejszy dla kogoś kto nigdy nie miał styczności z programowaniem. Instalujesz R i Rstudio i tyle wszystko śmiga.
- Większość analiz w wielu branżach odbywa się na niewielkich wolumenach danych więc prędkość nie ma znaczenia.
- Struktury danych w R są bardzo intuicyjne dla grupy docelowej (potwierdza to popularność
pandas
w pytonie ). - Po prostu jest dobry w tym co robi i nie ma nic złego w tym, że są to wąskie zastosowania o ile nikt nie próbuje na siłę ich rozszerzać.
W pytonie możesz zrobić dokładnie to samo, czy lepiej i szybciej to kwestia sporna, ale mam wrażenie, że to taki data sciencowy odpowiednik dyskusji niektórych programistów nad wyższością Javy nad C# i odwrotnie.

pandas
to rok 2008 ile lat minęło zanim zdobyła popularność (swoją drogą ciekawe skąd twórcy czerpali inspirację ;))? Prawda jest taka, że jak piszesz proste skrypty, składnia nie ma znaczenia (nie mówiąc już, że preferencje co do składni są różne). Nie chce mi się jakoś strasznie rozpisywać tutaj mamy porównanie języków (https://www.dataquest.io/blog/python-vs-r/) z którym można mniej więcej się zgodzić. Co więcej, żeby z pythonem pracować podobnie do R potrzebujesz jupitera
a i tak jest mniej wygodne i uboższe (przynajmniej na razie) rozwiązanie od tego co daje RStu

- Rejestracja:około 8 lat
- Ostatnio:ponad 4 lata
- Postów:1703
Python: https://www.tiobe.com/tiobe-index/python/
R: https://www.tiobe.com/tiobe-index/r/
Szach mat.

- Rejestracja:ponad 13 lat
- Ostatnio:prawie 3 lata
- Postów:4882
szach mat czego? Ze nadal nie jest popularny i ciezko w nim znalezc prace? Szczegolnie bezmyslnym fanatykom ktorzy tylko narzekaja i daja linki do statystyk bez kontekstu?
2 < 3
zacznij od prostej matematyki. Pozniej mozesz sie bawic w zapytania o ilosc pracy w danym jezyku. Jak nauczysz sie matematyki (podstaw) to zobaczysz, ze wynikow na rzecz pythona bedzie wiecej
- Rejestracja:prawie 8 lat
- Ostatnio:około 7 lat
- Postów:2
W bionaukach używa się tylko SAS i R, na zachodzie jeszcze paru innych kombajnów, ale z języków programowania to tylko te dwa. W Pythonie nie ma po prostu nic specjalnego, co mógłby zaoferować bio data scjentystom. OK, może poza genetyką, gdzie Python ma troszkę rzeczy, ale to nie do porównania z BioConductorem nawet. W farmacji i pochodnych nie używa się machine learning bo nie ma po co, tylko czystej statystyki i to bardzo specjalistycznej statystyki. Python jest lepszy w machine learning, za to taka specjalistyczna statystyka w nim to zaledwie wycinek, raczej nierozwijany, kto pracował ten wie. Nie ma nawet dobrych metod do imputacji danych, tylko podstawowe. Medycy mają swoje metody statystyczne, których w Pythonie po prostu brak, a tych ledwie parę co są to na żenującym poziomie. I to zrozumiałe. Bo niby po co je rozwijać, kto miały to robić? Komu mogą być potrzebne, to siedzi w SAS albo R. A ci, co im to niepotrzebne, i tak nie wiedzą gdzie szukać wiedzy na ten temat i nie mają zamiaru tracić czasu. Pythoniści zachłysnęli się big data i machine learning, więc tutaj rozwijają jego możliwości. I tutaj Python jest mega. Ale big kasa to nie tylko big data, a tam potrzeba statystyki, i tam Python raczej nie podskoczy, bo kuleje i to mocno. Myślę, że oba języki po prostu się podzieliły rynkiem. O ile jeszcze flame między javą a c# ma rację bytu, bo ich domeny się w 100% nakładają, to tutaj nie ma to sensu, bo oba środowiska służą do czego innego. Dla przeciętnego eRowca kod w Pythonie jest nieczytelny. Dla Pythonisty kod w R to rzeźnia. Obserwacja na podstawie kilku roczników studentów i kilkudziesięciu konferencji z naukowcami programistami R, którzy zobaczyli ten sam kod w Pythonie i ręce im opadły. Dla programisty to nie problem, bo programista zrozumie kod w każdym, nawet nieznanym sobie języku, przez analogię. Dla naukowca to ma wielkie znaczenie, bo on uczy się konkretnego narzędzia. O ile test t Studenta można odpalić w obu środowiskach, to już bardziej zaawansowana statystyka dziedzinowa w Pythonie to parodia. Za to np. tworzenie GUI w Pythonie jest przyjemne, a w R uciążliwe, w GTK albo Tcl/Tk. Swoją drogą to R wszedł do MS SQL Servera i PowerBI i to w niego Microsoft zainwestował w 2016 i 2017, nie mówiąc o Oracle, które wypuściło R Enterprise. Ale i Pythonem MS się podobno interesuje, więc może oba języki będą wspierane przez jego narzędzia analityczne.

scibi92