Datamaskiner erstatter journalister i USA

narrative scienceDet er allerede to år siden New York Times fortalte om selskapet Narrative Science. Selskapet har utviklet datamaskiner som kan skrive artikler på bakgrunn av tall, slik som sportsresultater eller sammendrag av økonomiske kvartalsrapporter.

Artiklene, som allerede er å finne på enkelte fagnettsteder i USA, er umulig å skille fra artikler forfattet av mennesker. Så langt har språkteknologien og kunstig intelligens kommet. Dette er kanskje ingen overraskelse siden mange husker IBMs datamaskin Watson, som kunne svare på spørsmål like godt som et menneske.

De data-genererte artiklene blir et positivt bidrag til pressen- i begynnelsen. New York Times skriver om en bredere dekning av lokal sport og av økonomiske realiteter som man vanligvis ikke ville ha tid til å dekke. Men hvor langt kan dette gå?

Nylig viste NRK en dokumentar i serien Verdas språk, hvor amerikanske forskere fortalte om sitt arbeid med automatisk analyse av fortellinger. Allerede finnes søkemotoren booklamp.org (som jeg har skrevet om mange ganger) som skanner skjønnlitteratur og sammenligner fortellingene. Om man knytter sammen trådene i denne utviklingen ser man at den data-genererte skjønnlitteraturen ikke er langt unna.

Datamaskiner har allerede rukket å sette sitt preg på den vestlige verdens største historiefortellere: Hollywood. Statistikeren Nick Meaney leder selskapet Epagogix  som prøver å kvantifisere hva som kjennertegner et vellykket manuskript. Han analyserer filmmanuskripter og prøver å forutse hvilken suksess de vil få. Om en datamaskin kan produsere en feilfri tekst, om den kan analysere en fortelling og om den, som Meaney, kjenner publikums smak, kan den ikke da også konstruere en helt ny roman eller film?

Folk som Meaney har allerede møtt kritikk fordi han strømlinjeformer fortellinger. Hvordan skal man få nye fortellinger om alt skal kalkuleres fra det gamle? Evnen til å bryte de gamle mønstrene på en måte som er meningsfull for mennesker er foreløpig ikke innenfor datamaskinenes kapasitet. Artiklene som Narrative Science selger er også begrenset i den forstand at de er basert på rapporter og tall-materiale. Datamaskinene har ikke evnen til å vurdere hvilke saker som er viktig i verden eller avgjøre hvilken vinkling som er passende.

Reklamer

Nytt studium ved Oxford University

Denne måneden starter opptaket på det nye «filosofi og data»-studiet ved Oxford, det første nye filosofistudiet ved institusjonen siden 1973. Søkerne må være flinke i både data, matematikk og filosofi. Hensikten med studiet er å utforske de nye krysningene mellom filosofi-faget og data.

I kjølvannet av datarevolusjonen har det oppstått mange etiske dillemmmaer:  «Er kunstig intelligens liv?» «Hva skal vi gjøre med kunstig liv?» «Når er robotter levende?» Mange filosofiske teorier danner også rammen for dataprogrammer som lærer på egen hånd eller som simulerer menneskelig persepsjon. Kurset er på til sammen 3-4 år, hvor de første året er en innføring i filosofi og datavitenskap. De siste årene utforsker krysningene mellom fagfeltene.

Utviklingen ved Oxford er bare en del av en bredere satsning på «digital humaniora» i den engelskspråkelige verden. University of Nebraska har blant annet utvidet sin stab ved Center for Digital humanitiesDigital Humanities Conference, det mest prestisjetunge arrangementet innenfor faget, skal i tillegg avholdes i Nebraska i 2013.

Bruker søkemotor for å rangere Victorianske forfattere

ArsTechnica formidlet nylig en interessant historie om en litteraturforsker som brukte PageRank, googles søkealgoritme,  til å finne ut hvilke Victorianske forfattere som har hatt størst innflytelse. Det interessante er kanskje ikke at han identifiserte Walter Scott og Jane Austen som de med mest innflytelse på 1800-tallet, men måten han oppnådde sitt resultat.

Matthew Jockers fra University of Nebraska analyserte 3,592 digitaliserte romaner utgitt i  Storbritannia, Irland og USA mellom 1780 og 1900 ved hjelp av Google sin algoritme for å rangere nettsider, maskinlæring og andre teknikker. Analysen frembragte noen overraskelser, som f.eks at Onkel Toms hytte (1852), skrevet av en kvinne, hadde mer til felles med mannlige romaner enn kvinnelige. 

Matthew Jockers forelesning kan sees her

Jockers mener man ved hjelp av teknologi kan bygge en mer empirisk litteraturhistorie som viser den faktiske innflytelsen som ulike forfattere har hatt. Han viser blant annet til Ian Watts teori om at romanen utviklet seg fra en aristokratisk til en populær sjanger på 19 hundretallet. Ian Watt regnes som en av de viktigste engelskspråklige litteraturhistorikerne i verden. Hvordan kan vi bevise at dette var det som faktisk hendte? spør Jockers. Watt henviser kun til en håndfull forfattere, og til nå har man tatt hans ord for god fisk.  Nå kan vi undersøke dette skikkelig, mener Jockers.

Datamaskiner gjenkjenner tegninger

Forskere presenterte et interessant eksperiment ved Siggraph arrangementet i 2012. De  samlet inn 20 000 skisser av ulike objekter, og fant ut at mennesker var i stand til å gjenkjenne det som var avbildet i 73% av tilfellene. De greide imidlertid å programmere en datamaskin til å gjenkjenne objektene i tegningene i 56% av tilfellene, noe som viser at avstanden mellom menneske og maskin minsker. Videoen nedenfor viser hvor effektivt systemet er.