Po co używać w ogóle R do data science? Jedyną zaletą R nad Pythonem jest pare tysięcy bibliotek do statystyki, matematyki, matematyki finansowej itp. Czy nie lepiej jest przepisać wszystko do Pythona? Czemu część data scientistów to takie młoty? Czemu popularność R rośnie w tempie takim jak popularność pythona, mimo że R to kompletne badziewie i jego jedyną zaletą są te nieszczęsne biblioteki, które rozwijali przez ostatnie 20 lat profesorkowie zapaleńcy statystyki i które są rzeczywiście dobre, ale czy to znaczy że do końca świata mamy tkwić w tym zaklętym kole? Na grupie Data Science PL na fb dużo jest R-owców. Opamiętajcie się ludzie. Musimy coś z tym zrobić. Jakąś kampanie popularyzacji Pythona w Polsce. Trzeba jakoś przekonać tych profesorków z pw,agh,sgh,mim uw itp. do pythona.
R,Python, Julia, Data Science
Wątek przeniesiony 2017-04-09 17:27 z Nietuzinkowe tematy przez Rev.
- Rejestracja: dni
- Ostatnio: dni
@Julian_ @Shalom
Zapraszam do dyskusji ;)
- Rejestracja: dni
- Ostatnio: dni
- Postów: 1703
Proponuję byś stworył lepszy język i nazwał go swoim imieniem. Będziemy wtedy programować w Jacku.
A co do R... nie zrozumie latania ten kto nigdy nie latał.
- Rejestracja: dni
- Ostatnio: dni
Siedze w R i pythonie od dwoch lat, pod katem data science. W R glownie z przymusu. Python jest pod kazdym wzgledem lepszy. Składnia, obiektowość, biblioteki do sieci neuronowych, text miningu itp. Ostatnio chciałem się pobawić deep reinforcement learningiem, w R nic nie jest zaimplementowane. R to dobry jezyk dla amatorów, statystyków, analityków. Ale jak ktoś chce iść w kierunku najbardziej nowoczesnych odnóg data science, to w R jest pustka. Python jest lepszy.
- Rejestracja: dni
- Ostatnio: dni
- Postów: 1703
A wizualizowałeś coś kiedyś? R ora po całości wszystkie języki świata jeśli chodzi o wizualizację danych, pozwala na najpiękniejsze na świecie interaktywne wizualizacje. Do tego automatyzacja raportów i wsparcie reproductible research.
Jedyną prewagą Pythona nad Rem była szybkość - przy dużej ilości danych. Teraz kiedy narodziła się Julia, która jest nawet szybsz od Javy, Python już nie ma sensu.
- Rejestracja: dni
- Ostatnio: dni
This table shows that optimized Python code is faster than Julia for the first 6 examples, and slower for the last 2. Note that for Fibonacci I used the recursive code to be fair.
- Rejestracja: dni
- Ostatnio: dni
- Lokalizacja: Warszawa
- Postów: 118
JacekJackiewicz napisał(a):
Po co używać w ogóle R do data science?
Odpowiedzią jest:
JacekJackiewicz napisał(a):
R to dobry jezyk dla amatorów, statystyków, analityków.
- Analityków i statystyków potrzeba coraz więcej, a R jest moim zdaniem łatwiejszy dla kogoś kto nigdy nie miał styczności z programowaniem. Instalujesz R i Rstudio i tyle wszystko śmiga.
- Większość analiz w wielu branżach odbywa się na niewielkich wolumenach danych więc prędkość nie ma znaczenia.
- Struktury danych w R są bardzo intuicyjne dla grupy docelowej (potwierdza to popularność
pandasw pytonie ). - Po prostu jest dobry w tym co robi i nie ma nic złego w tym, że są to wąskie zastosowania o ile nikt nie próbuje na siłę ich rozszerzać.
W pytonie możesz zrobić dokładnie to samo, czy lepiej i szybciej to kwestia sporna, ale mam wrażenie, że to taki data sciencowy odpowiednik dyskusji niektórych programistów nad wyższością Javy nad C# i odwrotnie.
- Rejestracja: dni
- Ostatnio: dni
- Postów: 1703
Python: https://www.tiobe.com/tiobe-index/python/
R: https://www.tiobe.com/tiobe-index/r/
Szach mat.
- Rejestracja: dni
- Ostatnio: dni
- Postów: 4883
szach mat czego? Ze nadal nie jest popularny i ciezko w nim znalezc prace? Szczegolnie bezmyslnym fanatykom ktorzy tylko narzekaja i daja linki do statystyk bez kontekstu?
2 < 3
zacznij od prostej matematyki. Pozniej mozesz sie bawic w zapytania o ilosc pracy w danym jezyku. Jak nauczysz sie matematyki (podstaw) to zobaczysz, ze wynikow na rzecz pythona bedzie wiecej
- Rejestracja: dni
- Ostatnio: dni
- Postów: 2
W bionaukach używa się tylko SAS i R, na zachodzie jeszcze paru innych kombajnów, ale z języków programowania to tylko te dwa. W Pythonie nie ma po prostu nic specjalnego, co mógłby zaoferować bio data scjentystom. OK, może poza genetyką, gdzie Python ma troszkę rzeczy, ale to nie do porównania z BioConductorem nawet. W farmacji i pochodnych nie używa się machine learning bo nie ma po co, tylko czystej statystyki i to bardzo specjalistycznej statystyki. Python jest lepszy w machine learning, za to taka specjalistyczna statystyka w nim to zaledwie wycinek, raczej nierozwijany, kto pracował ten wie. Nie ma nawet dobrych metod do imputacji danych, tylko podstawowe. Medycy mają swoje metody statystyczne, których w Pythonie po prostu brak, a tych ledwie parę co są to na żenującym poziomie. I to zrozumiałe. Bo niby po co je rozwijać, kto miały to robić? Komu mogą być potrzebne, to siedzi w SAS albo R. A ci, co im to niepotrzebne, i tak nie wiedzą gdzie szukać wiedzy na ten temat i nie mają zamiaru tracić czasu. Pythoniści zachłysnęli się big data i machine learning, więc tutaj rozwijają jego możliwości. I tutaj Python jest mega. Ale big kasa to nie tylko big data, a tam potrzeba statystyki, i tam Python raczej nie podskoczy, bo kuleje i to mocno. Myślę, że oba języki po prostu się podzieliły rynkiem. O ile jeszcze flame między javą a c# ma rację bytu, bo ich domeny się w 100% nakładają, to tutaj nie ma to sensu, bo oba środowiska służą do czego innego. Dla przeciętnego eRowca kod w Pythonie jest nieczytelny. Dla Pythonisty kod w R to rzeźnia. Obserwacja na podstawie kilku roczników studentów i kilkudziesięciu konferencji z naukowcami programistami R, którzy zobaczyli ten sam kod w Pythonie i ręce im opadły. Dla programisty to nie problem, bo programista zrozumie kod w każdym, nawet nieznanym sobie języku, przez analogię. Dla naukowca to ma wielkie znaczenie, bo on uczy się konkretnego narzędzia. O ile test t Studenta można odpalić w obu środowiskach, to już bardziej zaawansowana statystyka dziedzinowa w Pythonie to parodia. Za to np. tworzenie GUI w Pythonie jest przyjemne, a w R uciążliwe, w GTK albo Tcl/Tk. Swoją drogą to R wszedł do MS SQL Servera i PowerBI i to w niego Microsoft zainwestował w 2016 i 2017, nie mówiąc o Oracle, które wypuściło R Enterprise. Ale i Pythonem MS się podobno interesuje, więc może oba języki będą wspierane przez jego narzędzia analityczne.