Politik

Category Archives: Big Data

Massiva datamängder och strömmande applikationer är grunden för dagens webbapplikationer

Published by:

Scale By the Bay-konferensen på Twitters Högkvarter i San Francisco fick jag lära mig en massa om hur man hanterar massiva datamängder, dvs vad som går under benämningen Big Data, i webbapplikationer. Svaret är Application Streaming med produkter som Kafka, Akka och Spark och Reactive Systems och mycket mer. Och med applikationer inom maskininlärning och AI. Forna tiders batch-processing håller inte för Big Data.

Den som är intresserad av det området bör läsa nedanstående gratis-rapport på nätet:Fast Data Architectures For Streaming Applications

Och givetvis kolla videon med Dean Wampler från Lightbend längs upp i det här inlägget, liksom presentationen under.

En mycket läsvärd rapport om ett nyckelområde på webben idag.

Linus Larsson om klickstatistik, big data och den digitala världen

Published by:

Den digitala världen är helt annorlunda än den invanda analoga värld som den ersätter. Det är något som vi först nu har blivit medvetna om. När all information är digitaliserad så kan vi också på några millisekunder utforska hur många svenskar som har vilka kombinationer av sjukdomssymptom genom att samköra databaser på olika landsting. Det går lätt som en plätt. Och på samma sätt kan tidningarna se precis vilka artiklar och vilket ordval som säljer.
Läs fortsättningen här

Los Angeles, hur Big Data kan identifiera risk för att unga blir yrkeskriminella

Published by:

Downtown Los Angeles

Vi vet redan att en majoritet av alla brott begås av ett mycket litet antal yrkeskriminella. Så ju snabbare vi kan identifiera ungdomar som riskerar att bli yrkeskriminella desto lättare skulle det bli att reformera dom och hålla dom borta från brott och fängelse.

Vilket faktiskt är möjligt med Big Data-analys, något som har testats i Los Angeles och som Matt Stroud skriver om i Pacific Standard: Should Los Angeles County Predict Which Children Will Become Criminals? One major difference separates troubling Minority Report policing programs from what happened in L.A. County’s child welfare system.

Läs fortsättningen här!

Måste läsas, Pedro Domingos The Master Algorithm. How the Quest for the Ultimate Learning Machine Will Remake Our World

Published by:

master-algorithm

Alan Turings magiska maskin som ligger till grund för alla dagens datorer kan helt utan att göra det minsta misstag utföra instruktioner som har specificerats i detalj av oräkneliga flinka programmerare.

Dagens IT-värld är baserad på oräkneliga oföränderliga algoritmer som liksom väldiga virtuella skördetröskor tröskar igenom ofantliga mängder data i de väldiga datormolnen.

Men det finns också en annan trend inom IT och det är maskinlärning som handlar om algoritmer som kan lära sig av den data dom hanterar. Ett bra exempel är hur vi googlar efter någonting, gör ett stavfel och snabbt ser hur Google har rättat felet och visar oss vad vi egentligen letar efter. Googles forskningschef Peter Norvin är, som det visar sig, en av maskinlärningens ledare. Som han visar i den här videon.

Nu har Pedro Domingos vid University of Washington i Seattle skrivit en fascinerande bok om just maskinlärning, som recenseras av David Auerbach i Slate: The Programs That Become the Programmers “Machine learning” is starting to reshape how we live. It’s time we understood it.
Läs fortsättningen här!

Big Data och avancerad bildanalys identifierar maskerade våldsmän i Sverige och USA

Published by:

BigData Stockholm

Jag brukar titta på SvTs Veckans Brott som ger en intressant och inte speciellt idyllisk inblick dagens Sverige. I veckans veckans brott om man så får säga, omkring 38 minuter in i inslaget så förekommer ett mycket intressant segment om hur polisen idag använder avancerad Big Data och bildanalys för att identifiera maskerade våldsmän.
Läs fortsättningen här!

Inte din farsas bönder, Big Data moderniserar det amerikanska jordbruket

Published by:

Det amerikanska jordbruket är ett världens mest mekaniserade och högeffektiva. Men det betyder inte att det kan bli ännu effektivare. Och det är därför som Big Data har blivit så viktigt för dagens amerikanska bönder. Inte bara i Mellanvästern utan också här i Kalifornien, som har ett av USA:s och västvärldens största och effektivaste jordbruksområde i den väldiga San Joaquindalen

I stort sätt så går Big Data-rörelsen ut på att man lägger ut digitala sensorer på åkrar och ängar som ger detaljerad information om jordens bördighet, om bevattningens och konstgödselns effektivitet osv. Alla dessa data kan samlas in och analyseras. Och, som videon ovan visar, idag kör skördetröskorna sig själva med hjälp av GPS.

Steve Lohr skriver i New York Times: The Internet of Things and the Future of Farming

Läs fortsättningen här!

Big Data från datahallarna till datormolnen lovar demokratisering och tillgång till avancerad dataanalys för alla

Published by:

Big Data är en s.k. megatrend som ger mänskligheten tillgång till alla dom data som skapas i det digitala samhället. Exempel är patientjournaler som nu har digitaliseras, data från jordbruket, från städer och kommuner, väderdata, väder från den globala ekonomin, från sjöfart, turism, sociala medier, den statliga massavlyssningen, osv i all oändlighet.

Men hittills så har de verktyg som behövs funnits i traditionella datahallar och inte uppe i datormolnen där dom är tillgängliga för alla.
Läs fortsättningen här!

Vi drunknar i gigantiska mängder data, som dock hjälper oss att förstå den värld i lever i

Published by:

answers-cover-final

I och med att samhället har datoriserats så genererar vi gigantiska mängder med data av alla sorter. Mängder som våra föräldrar och farföräldrar aldrig hade kunnat föreställa sig. Ett trivialt exempel. Fram till för ett år sen så kom varje månad en man och läste vår elmätare. Han öppnade dörren till vår trädgård, kom in tyst och försiktigt med en penna och ett pappersblock i handen och öppnade vår elmätare och skrev ner numret. Men idag är den försynte mannen försvunnen, antagligen arbetslös för nu är vår elmätare uppkopplad till Internet och läses av automatiskt minst en gång i minuten, om inte oftare.

Samma sak överallt i samhället. Och nu har städer som San Francisco börjat öppna alla stadens dataarkiv till allmänheten så att startupföretag och andra kan skriva appar som utnyttjar vad som trots allt är skattebetalarnas data.

Lev Grossman skriver i en omslagsartikel i Time Magazine:

Läs fortsättningen här!

Civic Analytics, vilket svenskt riksdagsparti blir först med att vinna val med Big Data?

Published by:

Amerikanska presidentval har alltid utnyttjat ny teknologi. Och de senaste åren har det handlat om Internet och avancerad datoranalys. Orsaken till att Barack Obama vann sina två val handlade mycket om att han utnyttjade Internet för att identifiera potentiella väljare som sen knöts till valkampanjen med skräddarsydda sociala medier och den modernaste av dataanalyser. Något som president Obamas kampanjchef Davids Plouffe har beskrivit i sin viktiga bok The Audacity to Win.

Men Big Data och analysteknologin har avancerad sen den tiden och nu lanserar ett Chicago-baserade företag med namnet Civic Analytics att man har lanserat datormolnsbaserade analystjänster i Amazons moln. Som vilken politisk kampanjorganisation som helst kan hyra.

Quentin Hardy skriver i New York Times: Bigger, Cheaper, Faster Data in the Cloud

Läs fortsättningen här!

Bortom Apache Hadoop, Apache Spark analyserar Big Data i datorminnet !

Published by:

Big Data är ett begrepp som handlar om de gigantiska datamängder som idag strömmar ut från miljarder mobiler, datorer, sjukhus, fabriker, och samhällen och upp i datormolnen. Där de kan analyseras och ge oss insikter om oss själva och vår värld.

Under de senaste åren har Silicon Valley blivit centrum för Big Data-rörelsen med att ental BiG Data-företag som Cloudera, Hortonworks och MapR. Men trots alla löften så har analysen av de gigantiska mängderna med data som vi idag genererar inte varit så framgångsrikt som man hade väntar sig.

Nu kommer en ny teknologi, också den från Silicon Valley, Apache Spark från Berkeley-universitetet som gör det möjligt att analysera stora datamängder i minnet. En teknologi som lovat ett kvantumsteg framåt för Big Data och aavanserad dataanalys av gigantiska datamängder.

Steve Lohr skriver i New York Times: IBM Invests to Help Open-Source Big Data Software — and Itself

Läs fortsättningen här!

Big Data, maskininlärning och djupa maskinkunskaper lockar riskkapital i Silicon Valley

Published by:

Big Data och maskininlärning är stort i Silicon Valley just nu. Vad Big Data handlar om har jag redan skrivit om här på bloggen och det är något som håller på att bli mycket stort bl.a. inom den svenska sjukvården.

Maskininlärning handlar om att maskiner, läs robotar men även mjukvarusystem som Amazons bokhandel på nätet, ska kunna lära sig om dig och dina intressen och anpassa sina sidor till vad man tror att du vill läsa om.

Ett bra exempel är Chrystal Knows, som Evan Salinger skriver om i Christian Science Monitor: Opinion: If predictive algorithms craft the best e-mails, we’re all in big trouble.
Läs fortsättningen här!

Silicon Valley, historisk trend, startupföretagen ersätter chefer med data

Published by:

Big Data: water wordscape

Allteftersom startupföretag får tillgång till data på alla nivåer så uppstår frågan varför man egentligen behöver speciellt många chefer? För chefskapet handlar traditionellt om att man sitter på data som de anställda inte får tillgång till.

Men varför kan inte vanliga anställda fatta beslut på sina respektive områden om man har tillgång till data?

Christopher Mims skriver i Wall Street Journal om en ny trend där chefer på mellanstadiet alltmer ersätts av data och algoritmer: Data Is the New Middle Manager
Läs fortsättningen här!

Hur datamäklarna påverkar ditt liv: Frank Pasquales intressanta bok The Black Box Society The Secret Algorithms That Control Money and Information

Published by:

Frank Pasquale är juridikprofessor vid University of Maryland med ett intresse i IT-teknologi och hur den påverkar våra dagliga liv. Det handlar inte bara om de algoritmer som NSA använder för att besluta om vem som skall massavlyssnas; som CIA använder för att besluta vilka människor man ska avrättas med drönare. Det finns också civila datamäklare som Acxiom och BlueKai som bygger använder algoritmer och data för att bygga upp profiler över oss alla. Profiler som sen används av andra oräkneliga företag för allt från marknadsföring till anställningsbeslut och liv och beslut inom sjukvården, eller om du ska få ditt bostadslån eller om polisen och ekobrottsmyndigheten ska intressera sig för dig. Eller om Migrationsverket kommer att låta dig stanna.

David Auerback recenserar Frank Pasquales bok: The Code We Can’t Control. Frank Pasquale’s new book highlights the dangers of “runaway data” and “black box algorithms.”
Läs fortsättningen här!

NoSQL-databasen MongoDB får $80 miljoner i nytt riskkapital!

Published by:

NYみやげのMongo goods貰った!

I en värld som alltmer handlar om Big Data, alltså gigantiska datamängder som samlas in av sensorer över hela samhället, så är databaser en nyckelteknologi. Och NoSQL-databaserna är de absoluta kungarna på datamarknaden. Och bland dom så är den New York+baserade öppna koddatabasen MongoDB den ledande.

Colleen Taylor skriver på TechCrunch att MongoDB nu har fått ytterligare $80 miljoner i nytt riskkapital, en mycket stor summa: MongoDB Has Raised Another $80 Million Läs fortsättningen här!