Politik

Historisk utveckling om Big Data och Hadoop, Google lovar att inte åberopa sina patent på MapReduce

Om det finns någon som inte har hört talas om Big Data så är jag inte riktigt säker på att jag tror er. Big Data är egentligen namnet på vårt moderna data-intensiva samhälle, där datorer och IT-system av alla de slag genererar tonvis med data, eller terabytes eller t.o.m. petabytes som det egentligen heter, varje timme, varje minut, varje sekund.

Och för att analysera och tyda alla dessa data så använder vi en Öppen Kod-produkt som heter Hadoop, som är baserad på en algoritm som skapades av Google och som heter MapReduce.

Det enda problemet med Hadoop är att Google har tio patent på MapReduce och om man skulle vilja så skulle man alltså kunna kräva miljonbelopp av alla Hadoop-leverantörer. Något som skulle tvinga många av dom på knä.

Men nu, som Cade Metz skriver på Wired, så har Google lovat att inte stämma leverantörer av den MapReduce-baserade Hadoop. Ett beslut som äntligen gör det helt säkert att använda Hadoop, och därmed placerar Big Data-rörelsen på stadig fot: Google Erects Patent Shield for the Open Source Internet

All of these web giants rely on Hadoop, an open source software platform for crunching data across hundreds or even thousands of computer servers, and Hadoop is based on technology originally developed at Google. A little less than a decade ago, Google published two research papers describing some of the software that juggles data inside its data centers, including a platform called MapReduce, and in short order, a community of software developers — led by Facebook and Yahoo — recreated these tools with open source code.

The rub is that Google owns several patents related to MapReduce and other data center technologies that have spawned widely used open source projects, and though Google is typically viewed as a friend of open source software, those patents have always posed at least a small threat to the web at large. Companies can change. Patents get sold.

But on Thursday, Google formally agreed not to assert 10 patents related to MapReduce — unless it’s attacked first.

Vi befinner oss hittills bara i början av Big Data-samhället som omfattar allt från DNA-sekvensering som från födseln kommer att sparas i våra sjukjournaler, till alla Twitter. Facebook och SMS-data vi genererar över hela världen. För att inte tala om alla data som FRA dammsuger från varenda svensk varenda sekund.

Det förekommer idag en kapplöpning mellan regeringar, myndigheter, företag och privatpersoner för att försöka analysera och tyda alla dessa data.

Och ett av de allra viktigaste verktygen i den globala Boig Data-rörelsen är alltså Hadoop. Som är uppkallat efter en av grundarnas söners gosedjur.

Pressklipp:
Ogooglebar i Nationalencyklopedin,Google besöker japansk spökstad, Rekordstor dataattack efter nätgräl

[tags]Big Data och Hadoop, Google patent MapReduce [/tags]