Politik

Dataspråket R för alla som vill lära sig manipulera Big Data med statistik

Allteftersom Big Data blir allt viktigare så blir också statistik och förmågan att bearbeta och visualisera data allt mer i ropet.

Dataspråket R, ett öppet kod-verktyg som kan laddas ner från den här länken är ett språk som har tagit den statistiska världen med storm. Det används bl.a. på New York Times för att visualisera data på olika sätt.

Sån datavisualisering blir nu allt vanligare allteftersom Big Data allt mer kommer att bli den lingua franca med vilken vi beskriver världen omkring oss.

Jag har börjat leka litet med språket, som är enkelt lära sig.

Det är t.ex. mycket enkelt att importera data från Excel eller andra kalkylprogram och sen bearbeta datan i R. Cirkeldiagrammet ovan är skapat genom att först läsa in några siffror
visitors så här visitors = c(300, 44, 30, 10, 5,61,7,82,9,10)
Jag kan alltså också enkelt läsa in dom från Excel.
Sen öppnar jag en PDF file på disken: pdf(file=’c:/temp/visitors.pdf’)
och sen skapar jag mitt cirkeldiagram: pie(visitors, main=”Visitors”, col=rainbow(length(visitors)), labels=c(“Sverge”,”USA”,”EU”,”Kina”,”Japan”,”Mellanöstern”,”Sydamerika”,”Kanada”,”Ryssland”,”Sydostasien”))

Och slutligen stänger jag filen dev.off()

Och resultatet är alltså en PDF fil från datan i Excel, bearbetad i R.

Nu kunde jag lika gärna ha skapat stapeldiagrammet direkt i Excel, men det viktiga här är att visa hur man kan importera data till R, manipulera den och sen exportera den ut igen i nytt format.

Man kan t.ex. också jobba med Bayesianska nätverk i R

New York Times använder sig alltså av R, och den som vill lära sig något matnyttigt bör absolut titta på R. Det är ett kul språk som ger jobb för den som vill syssla med att analysera Data och nu Big Data.

I alla fall bättre än att sitta och äta ostbågar och dricka rödvin och titta på Let’s Dance.

Pressklipp:

Computer Sweden 20 senaste nyhet

R-språkets Hemsida, En introduktion till R-språket

[tags]Big Data, R-språket, Statistik, Let’s Dance, Analys och Big Data [/tags]