Politik

Informationen digitaliseras och globaliseras Big Data och det nya informationssamshället

Big Data har blivit ett avde mest använda modeorden inom IT de senaste året. Hur definierar man Big Data, som ännu inte ens verkar ha blivit översatt till svenska? Det handlar om gigantiska datamängder som är så stora att de är besvärliga att hantera med hjälp av traditionella databassystem.

Big Data handlar om data i storleksordningen terabytes, exabytes och zettabytes av data. Och orsaken till att vi plötsligt har fått tillgång till så gigantiska datamängder är att all information som finns idag och som tidigare fanns t.ex. på papper nu digitaliseras och därför kan behandlas av datorer.

Vi stöter regelbundet på Big Data inom meteorologin, genomiken , connectomics, komplexa simuleringar inom fysiken, biologin och miljöforskningen, sökningar på Internet och inte minst inom finans-och affärsvärlden.

Man stöter allt oftare på Big Data även i dagspressen och Quentin Hardy skriver i New York Times om just Big Data:The Big Business of ‘Big Data’ – NYTimes.com

Big Data is clearly big business, adding a new level of certainty to business decisions, and promoting new discoveries about nature and society. That is why over the past two years I.B.M., E.M.C. and Hewlett-Packard have collectively invested billions of dollars in the field.

This past week, Oracle bought Endeca, a company to manage and search through large volumes of things like e-mail, for a rumored $750 million.

H.P. paid $10.3 billion for Autonomy, which does a much bigger version of the same thing. The first H.P. products with Autonomy technology, along with pattern-finding algorithms from an outfit called Vertica, which H.P. bought earlier this year, will most likely be out next month.

There are an uncountable number of data-mining start-ups in the field: MapReduce and NoSQL for managing the stuff; and the open-source R statistical programming language, for making predictions about what is likely to happen next, based on what has happened before. Established companies in the business, like SAS Institute or SAP, will probably purchase or make alliances with a lot of these smaller companies.

Man kan säga att hela det globaliserade kunskapssamhället alltmer vilar på Big Data som genereras av miljarder RFID-baserade censorer på allt från gas, olje och vattenledningar till digitalkameror, medicinska instrument, satelliter mm. Alla dessa data kan idag analyseras med hjälp av avancerade datorsystem, som dom som FRA använder för att massavlyssna hela svenska folket. Men liknande system används även på ett mer positivt sätt inom sjukvården för att hitta patienter som befinner sig riskzonen för olika sjukdomar.

Den som vill lära sig litet mer om Big Data bör kolla verktyg som Apache Hadoop som är en Öppen Kod-implementation av Googles Map Reduce.

Den fråga som vi måste ställa oss är hur Big Data påverkar den personliga integriteten när regeringar och myndigheter nu kan massavlyssna miljarder människor och genom avancerad dataanalys hitta hur många nålar i hur många höstackar som helst. Medicinska data brukar anonymiseras, dvs man tar bort oväsentlig information som patientens namn och adress, men så är inte alltid fallet på alla områden och för FRA är det just den personlig informationen som är själva kärnan.

Ett mycket spännande och oerhört viktigt område som jag själv håller på att sätta mig in i.

Axplock från den nordiska pressen:

Resumé: Nyheter,digi.no, digi.no, ITavisen.no

[tags] Online Privacy , Cybersecurity , Internet , Big Data , Data , Nstic , Privacy , Trust Framework , Technology News, Big Data Hadoop, Hadoop, NoSQL, NoSQL Big Data, Bid Data Analytics, Google Map Reduce, [/tags]