• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Data science

Aruba Cloud VPS - 50% taniej przez 3 miesiące!
0 głosów
3,368 wizyt
pytanie zadane 18 grudnia 2017 w Offtop przez michalo368 Użytkownik (770 p.)
zmienione kategorie 18 grudnia 2017 przez Patrycjerz

Witam!

Ostatnio zainteresował mnie temat uczenia maszynowego . Myślę ze jest to aktualnie temat na topie i coraz bardziej będzie miał znaczenie w świecie informatyki. Na drodze napotkałem się z statystykami że najbardziej popularne języki sprzyjające data science to Python i R. Wyczytałem również że język R nadaje się bardziej do analizowania danych i ich zestawiania a Python to bardziej uczenie maszynowe. Czy to prawda? Osobiście bardziej mnie interesuje uczenie maszynowe, czy zatem nauka Pythona będzie lepszą opcją? 

 

Ps. Po drodze napotkałem dwie lektury:

Python. Uczenie maszynowe

Data Science i uczenie maszynowe

Jakieś opinie na temat książek, która będzie lepszą opcją na start? 

 

3 odpowiedzi

+1 głos
odpowiedź 19 grudnia 2017 przez NaviFox Dyskutant (8,950 p.)
Ogólnie zasada jest taka, "Dajcie ludziom troche Pythona, matematyki i ze 2 ksiązki i liczcie na  to, że kogoś to zaiteresuje na tyle mocno, że będzie chciał brnąć w to dalej". Ja od razu Ci napiszę co będzie potrzebne mając nadzieję, że Cię nie zniechęcę. Po pierwsze matematyka i język angielski. Matematyka dyskretna, algebra liniowa, analiza matematyczna, statystyka, algorytmika i struktury danych oraz język angielski są o wiele wyższym priorytetem niż język programowania, który sam w sobie niczego za Ciebie nie zrobi. Python jest popularny ze względu na mnogość dostępnych narzędzi, jest łatwy do nauki i promowany na uczelniach jednak im wyższy poziom projektu tym Python staje się mniej użyteczny i traci na wartości. R jest ciekawym narzędziem do analizy statystycznej i wizualizacji, warto go znać. Osobiście postawiłbym na Scala/Clojure/Spark/Hadoop i R do Data Science oraz Python (do nauki podstaw), Common Lisp, Clojure do ML i AI. Stawiaj bardziej na programowanie funkcyjne niż imperatywne i szukaj materiałów, które pomogą Ci przystwoić ten paradygmat. Ogólnie czeka Cię masa nauki na wysokim poziomie, Big Data Science i ML to nie web developerka.

Materiały do nauki znajdziesz tutaj http://www.foxebook.net/ , słowa kluczowe (scala, functional programming, functional data structures and algorithms, spark/machine learning/data science, hadoop, concurrency, akka, python, clojure, common lisp, big data science, data analytics)
komentarz 19 grudnia 2017 przez Benek Szeryf (92,970 p.)

(...) im wyższy poziom projektu tym Python staje się mniej użyteczny i traci na wartości.

Mógłbyś rozwinąć myśl?

komentarz 9 maja 2018 przez lukasz&lukasz Nowicjusz (200 p.)
Czyli do zastosowań marketingowych, zwiększania sprzedaży lepiej uczyć się R?
komentarz 16 maja 2018 przez NaviFox Dyskutant (8,950 p.)
To zależy. R jest mocno wyspecjalizowanym językiem używanym do obliczeń statystycznych. Scala to język do ogólnego zastosowania, który odnalazł się w dziedzinie Big Data Science ale nie jest w tej dziedzinie uwięziony. Obydwa języki posiadają bogatą pulę bibliotek i narzędzi tak samo jak Python ale w przeciwieństwie do tego ostatniego mocno promują funkcyjny paradygmat tak ważny w Data Science. Jeśli nie masz sprecyzowanego problemu do rozwiązania i potrzebujesz języka, który będzie bardziej elastyczny to wybierz Scala, osobiście jednak zachęcam do spróbowania obydwu języków.
0 głosów
odpowiedź 19 grudnia 2017 przez PaulGilbert Gaduła (3,280 p.)
Matematyka, matematyka i jeszcze raz matematyka. Tematyka wyłącznie dla ludzi kochających matematykę, i to tych kochających przez duże "K".
0 głosów
odpowiedź 19 grudnia 2017 przez Schizohatter Nałogowiec (39,600 p.)
R jest dobry o tyle, że duży nacisk się w nim kładzie na optymalizację obliczeń i posiada dużo wbudowanych funkcji przydatnych w "data science", jak to nazwałeś. Natomiast jako język sam w sobie jest paskudny.

Jeśli chodzi o Python/Ruby to mamy dużo elegantsze języki, być może nieco wolniejsze, ale z pewnością posiadające mniejszą bazę narzędzi analitycznych.

Musisz więc wybrać, czy zależy Ci na bardzo dużej bazie narzędzi (gotowych), czy wystarczy Ci średniej wielkości baza narzędzi. Druga kwestia to czy nie będzie Ci przeszkadzać składnia R i nazwy funkcji. Ja dostawałem przy tym cholery.

Podobne pytania

+1 głos
1 odpowiedź 1,246 wizyt
0 głosów
2 odpowiedzi 816 wizyt
pytanie zadane 16 października 2020 w Rozwój zawodowy, nauka, praca przez gerid Nowicjusz (220 p.)

93,166 zapytań

142,177 odpowiedzi

321,946 komentarzy

62,495 pasjonatów

Advent of Code 2024

Top 15 użytkowników

  1. 688p. - dia-Chann
  2. 676p. - CC PL
  3. 675p. - Łukasz Piwowar
  4. 664p. - Marcin Putra
  5. 662p. - Łukasz Eckert
  6. 649p. - Michal Drewniak
  7. 641p. - rucin93
  8. 641p. - rafalszastok
  9. 629p. - Adrian Wieprzkowicz
  10. 629p. - Piotr Aleksandrowicz
  11. 621p. - Dawid128
  12. 612p. - Mikbac
  13. 611p. - ksalekk
  14. 606p. - Mariusz Fornal
  15. 602p. - Michał Telesz
Szczegóły i pełne wyniki

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj

Wprowadzenie do ITsec, tom 1 Wprowadzenie do ITsec, tom 2

Można już zamawiać dwa tomy książek o ITsec pt. "Wprowadzenie do bezpieczeństwa IT" - mamy dla Was kod: pasja (użyjcie go w koszyku), dzięki któremu uzyskamy aż 15% zniżki! Dziękujemy ekipie Sekuraka za fajny rabat dla naszej Społeczności!

...