Politik

Samkörning av databaser och anonymiserade data gör slut på den personliga integriteten

Cartoon: Big Data

Det här är något jag själv har jobbat med, och vad det handlar om är att när t.ex. sjukvården samlar på sig gigantiska mängder patientdata så brukar man “anonymisera” delar av de data man har fått in för att sen dela med sig av dom till andra intressenter. Det finns många som är intresserade av patientdata eller kunddata eller vad som helst som de använder för att utveckla nya produkter eller nya system.

Så man ändrar alla namn till fiktiva namn, ändrar eller kanske vi kan säga “fiktiviserar” personnummer, adresser och postnummer.

Och sen lämnar man ut den nya tvättade datan.

Men som Economist skriver så kan man idag samköra databaser med den fiktiviserade datan och trots tvättförsöken hitta den underliggande ursprungliga datan: Data privacy. We’ll see you, anon
Can big databases be kept both anonymous and useful?

The anonymisation of a data record typically means the removal from it of personally identifiable information. Names, obviously. But also phone numbers, addresses and various intimate details like dates of birth. Such a record is then deemed safe for release to researchers, and even to the public, to make of it what they will. Many people volunteer information, for example to medical trials, on the understanding that this will happen.

But the ability to compare databases threatens to make a mockery of such protections. Participants in genomics projects, promised anonymity in exchange for their DNA, have been identified by simple comparison with electoral rolls and other publicly available information. The health records of a governor of Massachusetts were plucked from a database, again supposedly anonymous, of state-employee hospital visits using the same trick. Reporters sifting through a public database of web searches were able to correlate them in order to track down one, rather embarrassed, woman who had been idly searching for single men. And so on.

Och det värsta är att det inte verkar vara möjligt att någonsin komma fram med en metod som gör sån här datatvättning säker.

Vi får anta att det här är något som även används av underrättelsetjänsterna i sina massavlyssningsaktiviteter.

Pressklipp:

USABloggen på Twitter

Fler inlägg om Kalifornien