Politik

USA-valets verklige hjälte: Nate Silver och hans statistiska datamodeller förutspår valutgången

Med sina otäcka påhopp och sin ständiga svartmålning av motståndaren, med sin gigantiska penningomsättning och det öppna hatet mellan de tbvå politiska lägren i USA, så kanske presidentvalet i USA mest kan liknas vid ett gammalt hederligt gängbråk mellan tung beväpnade och nedknarkade svenska MC-gäng. Knappast barntillåtet och ingenting som man vill utsätta sina barn för.

Men i alla gyttjan och dyngan så finns det en man som står ut som en verklig folkhjälte, den 34:årige statistikern Nate Silver, vars avancerade datamodeller av opinionsläget i USA-valet har gjort honom till den enda auktoritära källan i USA och världen om läget i presidentvalet.

Silver började sin karriär med att utveckla en statistisk algoritm med namnet Player Empirical Comparison and Optimization Test Algorithm som används för att analysera baseballspelares prestanda och karriärutveckling.

Statiska analyser på baseball-området har blivit väldigt viktiga här i USA, något som speglas i Hollywoodfilmen: MoneyBall.

Men det var i 2008 års USA-val som Nate Silver gjorde sig internationellt känd för sina mästerliga datamodeller. Modeller som gjorde det möjligt för honom att förutspå vinnaren i presidentvalet i 49 av USA:s 50 delstater plus alla USA:s 35 Senatsval. (Den enda delstat han missade vanns av Obama med en så tunn marginal som procent.

Nate Silver analyser finns att läsa på hans blogg på New York Times FiveThirtyEight som tar sitt namn efter antalet elektorer i det amerikanska presidentvalet. Det är dom och inte folket som väljer presidenten. Folket röstar fram elektorerna som sen röstar fram vinnaren. En elektor kan i princip rösta för vem han vill, men eftersom alla elektorer är trogna partigängare så händer det sällan att dom inte följer partilinjen.

Zeynep Tufekci skriver i Wired Magazine om Nate Silver och hans metodik: In Defense of Nate Silver, Election Pollsters, and Statistical Predictions

Polls tell you the likely outcome with some uncertainty and some sources of (both known and unknown) error. Statistical models take a bunch of factors and run lots of simulations of elections by varying those outcomes according to what we know (such as other polls, structural factors like the economy, what we know about turnout, demographics, etc.) and what we can reasonably infer about the range of uncertainty (given historical precedents and our logical models). These models then produce probability distributions. So, Nate Silver:

takes all the polls we have;
adds in factors to his model shown to have impacted election outcomes in the past;
runs lots and lots and lots of elections; and
looks at the probability distribution of the results.

What his model says is that currently, given what we know, if we run a gabazillion modeled elections, Obama wins 80 percent of the time. Note this isn’t saying if we had all those elections on the same day we’d get different results (we wouldn’t); rather, we are running many simulated elections reflecting the range of uncertainty in our data. The election itself will “collapse” this probability distribution and there will be a single result. [Thanks to Nathan Jurgenson for suggesting and helping with this clarification.]

Jag har själv börjat jobba med statistiska modeller inom sjukvården där man t.ex. vill förutspå hur ofta en patient som botas för någon krämpa sen återkommer inom några veckor med precis samma krämpa.

Det är oerhört vanligt inom den amerikanska sjukvården och det kostar miljardbelopp. Läkarna har hittills inte haft något som helst incitament för att se till att patienten inte får återfall, eftersom man tjänar pengar på varje läkarbesök.

Det är det som president Obama nu försöker stoppa genom sin sjukförsäkringsreform; det går under benämningen “Meaningful Use” och det
är något som Romney har lovat riva upp redan samma dag som han svärs in som president.

Genom att bygga upp en modell med patientens allmänna sjukdomstillstånd, hur många gånger han redan har återkommit, hans ålder, förmåga att läsa och förstå instruktioner på medicinflaskor, om han bor ensam, om han är kroniskt sjuk, och om den läkare som sköter honom har många återfallspatienter, så kan man rätt lätt bygga upp en mycket framgångsrik statistisk modell.

Nate Silver utför alltså inte egna opinionsundersökningar, han kör existerande opinionsundersökningar genom sina datamodeller och kan på det sättet beräkna sannolikheten av att den ene eller den andre kommer att vinna.

Det är också därför det är rätt meningslöst för svenska journalister att slå upp ännu en amerikansk opinionsundersökning med fetstil på tidnitarnas förstasidor. Det är inte individuella opinionsundersökningar som gäller utan statistiska analyser av de samlade opinionsundersökningarnas output.

Den som vill läsa mer om såna här modeller bör kolla Bayesiansk statistik och dataspråket R som är öppen kod.

Pressklipp:

Ny Teknik , SVT , Sveriges Radio , SVD , SVD , VG

[tags]Nate Silver, Statsics, Nate Silver USA-valet, Opinionsundersökningar i USA, Polls USAvalet, Vem vinner USA-valet Statistik i USA-valet[/tags]

6 thoughts on “USA-valets verklige hjälte: Nate Silver och hans statistiska datamodeller förutspår valutgången

  1. roger

    Lennart:

    där man t.ex. vill förutspå hur ofta en patient som botas för någon krämpa sen återkommer inom några veckor med precis samma krämpa.
    Det är oerhört vanligt inom den amerikanska sjukvården och det kostar miljardbelopp. Läkarna har hittills inte haft något som helst incitament för att se till att patienten inte får återfall, eftersom man tjänar pengar på varje läkarbesök.

    Nu kan ju du den amerikanska sjukvården sjukt mycket bättre men, incitament är väl precis vad man har. Om det däremot bara skulle finnas en aktör DÅ finns det inga incitament.

    Om man får återvända med samma krämpa till samma läkare gång på gång så ser man väl till att byta läkare? Är man missnöjd med något/någon så skriver man dessutom dåliga recensioner och pratar negativt om produkten/tjänsten.
    Det är av denna anledning oerhört viktigt för läkaren att göra ett bra jobb eftersom hen annars förlorar han sina kunder.

    Med din logik borde Google försämra sin sökmotor så att folk får söka oftare för att hitta vad de söker?
    -Men, empirisk forskning visar att konkurrens sannolikt skulle få folk att byta sökmotorleverantör till ett bättre alternativ, t.ex. altavista eller yahoo eller . . . .

    Varför tror så många konsekvent att konkurrensen inte skulle kunna gälla mellan välfärdsföretag?
    -Går ni till en erkänt usel tandläkare?
    -Tänker ni sätta era barn i den sämsta skolan?
    -Tänker ni själva välja den äldrevård med sämst recensioner?
    -Tänker ni välja den doktor dit man uppenbarligen får återvända med samma krämpa inom några veckor?

    Saknas det verkligen incitament för privata aktörer inom välfärd att göra ett bra jobb?

  2. San

    Man undrar bara vad som händer med trovärdigheten när man förutspår en storseger för Romney och att alla har haft fel. Tillslut hamnar man på trovärdighetens skräphös, precis som Trump, Palin, Glenn Beck mfl, det håller ett tag men tillslut imploderar det, t.o.m. Fox News har tröttnat på Palin och de verkar inte bjuda in Trump längre efter senaste veckornas utspel.

    Tror faktiskt att Dick Morris var Demokrat en gång i tiden. Nyfrälsta är alltid de mest fanatiska, vare sig det gäller religion eller politik.

  3. San

    Det känns roligt att höra Dick Morris et al förutspå en Romney vinst i Pennsylvania med 8%, hur orkar dom sitta och snacka skit som dom vet inte stämmer. Det är som två tolvåringar som diskuterar sina favoritlag i fotboll.

    1. Lennart

      San: Dick Morris är en märklig person. Orsaken till hans snack är att Romneys vägar till Vita Huset nu har stängts den ena efter den andra och hans enda kvarvarande väg leder genom en seger i Pennsylvania. Som inte är speciellt trolig. Den andra möjligheten är att han vinner Ohio genom utbrett valfusk.

  4. Edward i Orlando

    Håller med till 100%.
    Nate Silver är en stråle av intelligens i den alldeles för onödigt långa valkampanjen.
    Se det så här: Du äger en TV station. Ju jämnare och oförutsägbarare (vackert ord!) du kan få valutgången att se ut desto mer kommer de politiska kampanjerna att spendera på reklam. Och som vi vet handlar det inte om småpengar!
    Jämnare kampanj = fler tittare = mer reklam = mer pengar. So much for objectivity!
    Jag är jädrans trött på hela cirkusen. Inte minst många (inte alla, men alltför många) av de republikanska volontärerna!!! Jag arbetar återigen för Obama kampanjen (dörrknackning, telefonrigning, skyltviftning osv) och kan tyvärr inte mer än konstatera igen att många av mina republikanska motsvarigheter är aggressiva och hatfyllda idioter. Speciellt på de platser där man kan rösta på förhand (i Orlando är det i princip på biblioteken) och därmed stöter på dessa av hat förgrämda personer har jag blivit utskälld när jag ex plockat upp Romney skyltar som blåser iväg för att ge tillbaka till “rätt” person: “Get your filthy hands off it you socialist bastard”. För att nämna en av de vänligare kommentarerna. Jag önskar att jag överdrev, tyvärr inte. Några yngre volontärer som blivit utsatta för liknande kommentarer när de kommit “för nära” en Romneyskylt, har börjat storgråta och vi har tvingats ringa efter föräldrarna för att hämta upp dem.
    Men snart är det slut – med en återvald Obama!!

    1. Lennart

      Edward: Bra att du jobbar för Obama och intressant att få litet lokalfärg från fältet. Jo att republikaner inte är trevliga människor har jag nog mer erfarenhet från här i Kalifornien. Det finns en klar skillnad mellan demokrater och republikaner som jag inte tror har uppmärksammats i den svenska pressen.

Comments are closed.