Politik

Big Data och data-styrd journalism tränger in på tidningsområdet

Deb Roy talar om Big Data på TED-konferensen här i Kalifornien.

Big Data är ett splitternytt begrepp som jag har skrivit om tidigare här på bloggen: Big Data och Hadoop, ny öppen kodrörelse och den sociala webben, Har du koll på Hadoop, en av hörnpelarna i den globaliserade sociala webben? och Analytics, dataanalys med Hadoop förändrar samhället.

Big Data har gjort sitt intrång på webben genom Googles massiva sökmotor och de sociala nätverken. Men Big Data, alltså petabytes med data, i sanning gigantiska, nästan oöverskådliga mängder data, håller också på att förändra journalistiken.

Tänk bara på Jasminrevolutionen med säkert hundratusentals Twitter-flöden, realtidsvideon, digitalbilder och Youtubevideon, hur hanterar tidningarna ett så gigantiskt nyhetsflöde?

Men det är bara början, allt fler länder kommer att följa USA:s ledning och på sikt att öppna sina databaser och göra datan, den som inte är konfidentiell givetvis, tillgänglig till vem som helst på nätet.

Ett synnerligen intressant exempel på det är Open Kenya, i Kenya, där regeringen är framsynt nog att inse att all den information som regeringen sitter på kan bli till guld om Kenyas IT-intreprenörer får tillgång till den.

Mathew Ingram på GigaOm skriver om hur stiftelsen Knight Foundation uppmuntrar datastyrd journalistik: When big data meets journalism

SwiftRiver. SwiftRiver, … was developed by the founders of Ushahidi, an information network designed to allow rescue workers and other volunteers to find and share information during a crisis or disaster like the recent earthquake in Japan. SwiftRiver is a series of tools that allow anyone trying to make sense of that information — including journalists — to filter and determine the accuracy of those real-time reports.
Overview. Developed by a team of journalists at The Associated Press including Jonathan Stray, this project got $475,000 to develop visualization tools that will help journalists explore large data sets. In one early prototype of what the project hopes to do, Stray created a visualization of all the text in the Iraqi war logs.

Den gamla traditionen med journalister med ett stall av kontakter som man ringer upp för att sen sent på kvällen skriva ut en artikel på en knattrig skrivmaskin är för länge sen historia. Men inte ens datorn kommer att kunna rätta den klassiske journalisten. I framtiden kommer dataanalyser skapade med verktyg som Hadoop att stå för nyhetsflödet, som sen kommer att läsas av mjukvarurobotar i våra mobiler.

En intressant websajt på det här området är Document Cloud, Analyze, Annotate, Publish, Turn Documents into data.

Framtiden är redan här och den heter Big Data och de avancerade datatorbaserade verktyg som kan analysera datan.

Axplock från den nordiska pressen:

Nyheter – Nyheter,
SvD – Senaste nytt, Resumé: Nyheter
[tags] Big Data, Journalism, Pressen och Data, Big Data Journalism, den amerikanska pressen, Deb Roy[/tags]