Liigu sisu juurde

Käivitage lahter uuesti ja silt muutub väärtuseks In [2], kuna nüüd oli rakk teine, mida kernelil käivitati. Pange tähele, et brauseris märkmiku vahelehe sulgemine seda teeb mitte "Sulgege" oma märkmik nii, nagu sulgeb dokument traditsioonilises rakenduses. See näitab, kuidas sülearvuti voog muudab andmeteaduse ülesanded meie jaoks töötamise ajal intuitiivsemaks ja teistele, kui on aeg oma tööd jagada. Tellitud loendite jaoks.

Andmeteaduse õppimine tasuta Üks parimatest andmetöötlustööstuses RSTUDIO valikute kauplemine asjadest on see, et see on täis tasuta tööriistu. Andmeteaduste kogukond on üldiselt üsna avatud RSTUDIO valikute kauplemine andev ning paljud tööriistad, mida professionaalsed andmeanalüütikud ja andmeteadlased iga päev kasutavad, on täiesti tasuta.

Kui te alles alustate, võib teie käsutuses olevate ressursside arv olla aga tohutu. Nii et selle asemel, et matta teid avatud lähtekoodiga maiustuste loendisse, oleme välja valinud mõned meie absoluutsed lemmikud: parimad tasuta tööriistad andmeteaduse jaoks, kasutades Pythoni, R-i ja SQL-i.

Keeled Seda on lihtne unustada, sest need on nii üldlevinud, kuid programmeerimiskeeled on tõepoolest parimad tasuta teadustöö tööriistad. Lihtsalt ühe neist keeltest õppimine paneb teie käeulatuses tohutu analüütilise jõu. Ja need kolm, mida siin loetlesime - kolm andmeteaduses kõige sagedamini kasutatavat keelt - on kõik täiesti tasuta kasutatavad.

Postitavate inimeste jaoks on keel kõige suurem valik, mida nad andmeteaduse tööriistade valimisel teevad. Kolm parimat keelt on: Leiate sadu artikleid, mis üritavad eristada, milline Pythonist ja Rist on andmeteaduse jaoks parem. Oleme kirjutanud oma artikli, milles võrreldakse Pythoni ja R-d objektiivsematel põhjustel - kuidas iga keel tegeleb tavaliste andmeteaduslike ülesannetega.

Närvivõrgud R on vaba tarkvara keskkond statistiliseks arvutamiseks ja graafikute koostamiseks.

Reaalsus on see, et mõlemad on suurepärased võimalused, millel on mõlemal oma tugevused, mille me allpool kirjeldame. RSTUDIO valikute kauplemine seevastu täiendab nii Pythoni kui ka R-d rohkem. See ei pruugi olla esimene keel, mida õpite, kuid teie tahe vaja seda õppida.

Pythoni juhendaja Üliõpilas, eemalt Ma aitan ette valmistada olulise eksami või me mõistame, mis kunagi unustati või vahele sissejuhatav kursus iT. OO loomise ja haldamise paljulubamistes suundades.

R R-programmeerimiskeel loodi algul 90ndate keskel. R on valitud akadeemiline ringkond statistikakeel ja sellel on maine, et seda on lihtne õppida, eriti neile, kes pole kunagi varem programmeerimiskeelt kasutanud. R-keele peamine eelis on see, et see oli mõeldud peamiselt statistiliseks arvutuseks, nii et paljud teadlastele vajalikud põhifunktsioonid on sisse ehitatud.

17 parimat tasuta andmetöötlusvahendit - Dataquest

R-il on ka tugev pakettide ökosüsteem, mis võimaldab laiendatud võimalusi. Andmetega töötamisel on palju R-pakette, mida paljud peavad oluliseks. Python Nagu R, loodi ka Python 90ndatel. Kuid erinevalt R-st on Python üldotstarbeline programmeerimiskeel. Seda kasutatakse sageli veebiarenduses ja see on üks populaarsemaid programmeerimiskeeli.

Pythoni kasutamine andmeteadustööks hakkas populaarseks muutuma ndate keskpaigast kuni lõpuni pärast seda, kui tekkisid spetsiaalsed raamatukogud analoogsed R-pakettidegamis pakkusid paremat funktsionaalsust andmetega töötamiseks.

Viimase kümnendi jooksul on Pythoni kasutamine andmeteaduste keelena tohutult kasvanud ja see on nüüd mõnede mõõdikute järgi populaarseim andmeteaduse keel. Pythoni üks peamisi eeliseid on see, et kuna see on üldotstarbeline keel, on teie andmetöödega ristuvaid üldisi ülesandeid lihtsam teha. Samamoodi, kui õpite Pythoni ja otsustate hiljem, et tarkvaraarendus sobib teile paremini kui andmeteadus, RSTUDIO valikute kauplemine suur osa õpitu üle kantav.

SQL on keel, mida kasutatakse andmebaasides salvestatud andmetega suhtlemiseks. Kuna suurem osa maailma andmetest on salvestatud andmebaasidesse, on SQL õppimiseks uskumatult väärtuslik keel. Tavaliselt kasutavad andmeteadlased SQL-i andmete hankimiseks, mida nad seejärel Pythoni või R abil puhastavad ja analüüsivad.

Paljud RSTUDIO valikute kauplemine kasutavad SQL-i ka esmaklassilise analüüsikeelena, kasutades tööriistu, mis võimaldavad visualiseeringuid ja aruandeid ehitada otse SQL-i päringute tulemustest. R paketid R-il on õitsev pakettide ökosüsteem, mis lisab R-põhikeele funktsionaalsust.

Allpool loetletud paketid on R-is kõige sagedamini kasutatavad ja populaarseimad andmeteaduse paketid. Korralik Tehniliselt korrastatud on R-pakettide kogu, kuid lisame selle siia koos, kuna see on R-s kõige sagedamini kasutatav Paevakaubanduse eeskirjade valikuvoimalused jaoks.

Kollektsiooni võtmepaketid sisaldavad andmete manipuleerimiseks dplr, andmete importimiseks readr, andmete visualiseerimiseks ggplot2, ja paljud teised. Isegi kui ggplot2 on osa korrastatud kogumikust, on see enne kollektsiooni algust ja on piisavalt oluline, et mainida on omaette.

R sisaldab sisseehitatud joonestamisfunktsionaalsust, kuid paketti ggplot peetakse üldiselt paremaks ja hõlpsamini kasutatavaks ning see on andmete visualiseerimise pakett number üks.

R Markdown R Markdown pakett hõlbustab aruannete loomist, kasutades R. R Markdown dokumendid on tekstifailid, mis sisaldavad koodilõike, mis on põimitud märgistuse tekstiga. R Markdown-dokumente redigeeritakse sageli sülearvuti liideses, mis võimaldab koodi ja teksti kõrvuti luua. Sülearvuti liides võimaldab koodi käivitada ja koodi väljundit näha tekstiga koos. Läikiv Pakett Shiny võimaldab teil luua R. Saate luua funktsionaalsuse, mis võimaldab inimestel teie andmetega, analüüside ja visualiseerimistega veebisaidina suhelda.

Shiny on eriti võimas, kuna see eemaldab rakenduste loomisel vajaduse veebiarenduse oskuste ja teadmiste järele ning võimaldab teil oma andmetele keskenduda.

Programmeerimine juhendaja keel Python. Python juhendajad

Kui R-il on sisseehitatud masinõppevõimalused, on nendega töötamine tülikas. ML pakub lihtsamat liidest, et saaksite keskenduda oma mudelite koolitamisele. Pythoni raamatukogud Nagu R-il, on ka Pythonis õitsev pakettide ökosüsteem, ehkki Pythoni pakette nimetatakse sageli teekideks.

Erinevalt R-st ei ole Pythoni peamine eesmärk andmeteaduste keel, seega on andmetele keskenduvate raamatukogude, nagu pandad, RSTUDIO valikute kauplemine Pythonis olevate andmetega töötamiseks enam-vähem kohustuslik.

Pythoni RSTUDIO valikute kauplemine saab alla laadida aadressilt PyPI Pythoni paketi register kasutades pip, tööriist, mis on varustatud Pythoniga, kuid on väljaspool Pythoni kodeerimiskeskkonda.

Pipi täiendav alternatiiv on korteri pakettide haldur, millest räägime hiljem. Ehkki tegemist on ühe paketiga, on selle lähim analoog R-s tidiverse kollektsioon. Lisaks suurele mugavusele pakuvad pandad andmetega Mida tahendab aktsia muugi valikud sageli ka puhast Pythonit.

RSTUDIO valikute kauplemine Mis on valikute kaupleja

Nagu R, kasutavad pandad ära ka vektoriseerimist, mis kiirendab koodi täitmist. NumPy NumPy on põhiline Pythoni teek, mis pakub funktsionaalsust teaduslikuks arvutamiseks. NumPy pakub põhiloogikat, millele pandad on üles ehitatud. Tavaliselt töötab enamik andmeteadlasi pandadega, kuid NumPy tundmine on oluline, kuna see võimaldab teil vajaduse korral juurde pääseda mõnele põhifunktsioonile.

Matplotlib Matplotlibi teek on Pythoni jaoks võimas joonistusraamatukogu. Andmeteadlased kasutavad sageli Pyploti moodulit raamatukogust, mis pakub andmete joonistamiseks standardset liidest.

Pandades sisalduv joonestamisfunktsioon kutsub Matplotlibi kapoti alla, nii et matplotlibist arusaamine aitab pandades tehtud kruntide kohandamisel.

RSTUDIO valikute kauplemine Kuidas asuda veebilehel

Scikit-Learn Scikit-learn on Pythoni jaoks populaarseim masinõppekogu. Raamatukogu pakub NumPy ja Matplotlibile ehitatud tööriistakomplekti, mis võimaldab masinõppemudelite ettevalmistamist ja koolitamist. Scikit-learn teegiga loodud süžeed Saadaolevad mudelitüübid hõlmavad klassifikatsiooni, regressiooni, klastrite moodustamist ja mõõtmete vähendamist.

Tensorivoog Tensorflow on algselt Google'i välja töötatud Pythoni teek, mis pakub liidest ja raamistikku närvivõrkudega töötamiseks ja süvaõppeks. Tarkvara Siiani oleme uurinud andmeteaduse parimaid keeli ja kahe selle keele parimaid pakette.

Päringukeelena on SQL natuke erinev ja ei kasuta "pakette" samas tähenduses. Järgmisena vaatame mõningaid tarkvaratööriistu, mis on kasulikud andmeteaduse töö jaoks. Need pole kõik avatud lähtekoodiga, kuid need on kõigile kasutamiseks tasuta ja kui töötate regulaarselt andmetega, võivad need olla ajasäästjad.

Kuidas puhastada R-i twitteri andmeid?

Google'i arvutustabelid Kui see ei oleks nimekiri tasuta tööriistad, oleks kahtlemata selle loendi tipus ka Microsoft Excel. Üldlevinud arvutustabeli tarkvara muudab andmetega visuaalsel viisil töötamise kiireks ja hõlpsaks ning seda kasutavad miljonid inimesed kogu maailmas. Google'i Exceli kloonil on Exceli põhifunktsioonid ja see on tasuta saadaval kõigile, kellel on Google'i konto.

See sisaldab koodiredaktorit, R-konsooli, märkmikke, tööriistu joonistamiseks, silumiseks ja palju muud. Lisaks on Rstudio ettevõte, kes valmistab Rstudio Desktopi kaasaegse R-arenduse keskmes, kasutades värviliste, läikivate ja muude oluliste R-pakettide arendajaid.

RSTUDIO valikute kauplemine Aktsiate kaotamine Ettevottest lahkumise voimalused

Jupyteri märkmik Jupyteri märkmik on Pythoni andmetöötluse jaoks kõige populaarsem keskkond. Sarnaselt R Markdownile võimaldavad Jupyteri märkmikud kombineerida koodi, teksti ja süžeed ühes dokumendis, mis muudab andmete töö lihtsaks. Dataquesti juhendatud Pythoni andmeteadus projitseerib peaaegu kõiki ülesandega õppijaid Jupyteri märkmike hooneprojektidega, sest just seda teevad töötavad andmeanalüütikud ja teadlased reaalses töös.

Anaconda Anaconda on Pythoni levitamine, mis on loodud spetsiaalselt teaduslike Pythoni tööriistade installimiseks. Enne Anaconda oli ainus võimalus installida Python ise ja RSTUDIO valikute kauplemine ükshaaval installida sellised paketid nagu NumPy, pandas, Matplotlib.

See ei olnud alati otsene protsess ja uutel õppijatel oli see sageli Binaarse valikuvahemiku strateegia. Anaconda sisaldab kõiki põhilisi andmeteaduse jaoks vajalikke pakette ühe lihtsa installina, mis säästab aega ja võimaldab teil kiiresti alustada. Sellel on ka sisseehitatud Jupyteri sülearvutid ja see võimaldab uue andmeteaduse projekti käivitamist kanderaketi aknast hõlpsasti juurde pääseda.

See on soovitatav viis Pythoni kasutamise alustamiseks andmeteaduste jaoks. Anaconda sisaldab ka conda paketihaldurit, mida saab kasutada piponi alternatiivina Pythoni pakettide installimiseks kuigi soovi korral võite kasutada ka pipi.

Andmeteaduse õppimine tasuta Eespool oleme loetlenud mõned parimad tasuta andmetöötlusvahendid. Kuid loomulikult on enamik neist tööriistadest tõeliselt kasulikud alles siis, kui olete õppinud nende tõhusaks kasutamiseks vajalikke oskusi. Õnneks on ka andmeteaduse õppimiseks palju suurepäraseid tasuta ressursse!

Oleme esile tõstnud mõned parimad tasuta andmeteaduste raamatud ning õppimise hõlbustamiseks oleme avaldanud palju tasuta Pythoni õpetusi ja R-õpetusi. Parim viis õppida on siiski koodi kirjutamine. Meie interaktiivsed brauserisisesed kursused viivad teid kiiresti reaalse koodi kirjutamiseni ja tegelike andmetega töötamisse.

Ja kaks esimest täiskursust - see on tunde ja tunde õppimist, mis hõlmab kõiki põhialuseid ja palju muud - on meie kõigi RSTUDIO valikute kauplemine jaoks tasuta.

Programmeerimine juhendaja keel Python. Python juhendajad

Me ei kasuta videoid, valikvastustega küsimusi ega tühja koha täitmist. Selle asemel kutsume teid üles rakendama kõike, mida õpite, kohe algusest peale reaalses funktsionaalses koodis. Ja kontrollime teie vastuseid automaatselt, veendumaks, et teil on kõik korras.