Politik

Recorded Future, Bayes Sats, förutsägande analys och framtidens webbsök

Alla som följde det amerikanska presidentvalet förra året kunde se hur New York Times datavetare Nate Silver, på sin blogg kunde förutsäga valutgången i varenda amerikansk delstat, utan att göre det minsta lilla fel.

Nu har Nate Silver sina kritiker, som Gary Marcus och Ernest Davis i en viktig artikel i New Yorker , men det bara visar att förutsägande datoranalys inte är så enkel som man kanske skulle tro.

Just nu satsar företag här i Silicon Valley och världen över gigantiska belopp på det här området, eftersom möjligheterna till nya applikationsområden ses som i det närmaste obegränsade.

Förutsägande datoranalys är baserad på Bays Sats inom sannolikhetsteorin, som används för att bestämma betingade sannolikheter; sannolikheten för ett utfall givet ett annat utfall.

Satsen har fått sitt namn av matematikern Thomas Bayes (1702-1761). Dess betydande roll inom statistiken grundar sig sedan länge på att satsen förenklar beräkningar av betingade sannolikheter.

Men det man använder idag t.ex. även Neuronnät och flera moderna variationer på Bayes Sats.

Tom Simonite skriver i MIT Technology Review om ett startupföretag med namnet Recorded Future i Cambridge i Massachusetts som har utvecklat en sökmotor på det här mycket spännande området och som har fått nära 21 miljoner dollar i riskkapital både från Google och CIA: A Web startup demos a “predictive” search engine.

A startup called Recorded Future has developed a tool that scrapes real-time data from the Internet to find hints of what will happen in the future. The company’s search tool spits out results on a time line that stretches into the future as well as the past.

The 18-month-old company gained attention earlier this year after receiving money from the venture capital arms of both Google and the CIA. Now the company has offered a glimpse of how its technology works.

Conventional search engines like Google use links to rank and connect different Web pages. Recorded Future’s software goes a level deeper by analyzing the content of pages to track the “invisible” connections between people, places, and events described online.

“That makes it possible for me to look for specific patterns, like product releases expected from Apple in the near future, or to identify when a company plans to invest or expand into India,” says Christopher Ahlberg, founder of the Boston-based firm.

Förutsägande analys är ett oerhört spännande område som har framtiden för sig. Den som är intresserad av statistisk programmering, som förutsägande analys är en del av, bör absolut kolla Det populära R-språket.

Och om den här teknologin så småningom kommer att bakas in i Google och Bing så kommer det att öppna helt nya dimensioner inom webbsöket.

Pressklipp:
Så ska stadsnäten klara datalagringen,

[tags] Predictive Analytics, Förutsägande Analys, R-språket,Recorded Future[/tags]