De fleste av oss tror at data er noe som tilhører naturfagene og samfunnsfagene, mens litteraturstudiet, forståelsen av fortellingene, ikke kan utføres ved hjelp av informasjonsteknologi.
De fleste blir overasket når de hører at man ihvertfall siden 1990-tallet har brukt dataprogrammer til å analysere ordbruken og stilen i en fortelling. I enkelte debatter, som i opphavsdebatten om Shakespeare sine skuespill, har datamaskiner vært viktige. Hvilke ord forfatteren bruker og hvor ofte kan lett klarlegges av et dataprogram, og dermed kan man danne seg hypoteser om hvem som har skrevet hva. Dataprogrammer har også blitt brukt til å analysere stilen til Agatha Christie i et forsøk på å forstå hvordan hun kunne bli planetens mest-selgende forfatter. Tilnærmingen jeg har skissert ovenfor er såkalt kvantitativ tilnærming til litteratur. Den er allerede tilgjengelig for alle med et tasttrykk på siden Autocrit.com
Det finnes imidlertid en annen tilnærming som også egner seg for datamaskiner, og det er den såkalte strukturalismen. Strukturalismen leter etter strukturer i fortellinger, modeller som kan forklare fortellingens oppbygning. Her snakker man ikke bare om synsvinkel, men om akter, om “story beats”, sekvenser osv. Denne typen tilnærming har blitt en del av dataprogrammer som Dramatica Pro og Power Structure.. Bakdelen er imidlertid at brukeren selv må gjenkjenne de ulike elementene i en fortelling og plotte dem i dataprogrammene.
Den såkalte “missing link” som lar oss kombinere strukturalisme og kvantitativ analyse i en dataanalyse av en fortelling er tilsynelatende kunstig intelligens og språkforståelse. Men nå har det seg slik at dette problemet er løst, og jeg har skrevet om en maskin som kan møte et slikt problem tidligere på bloggen: IBMs Watson. IBMs Watson maskin kan forstå menneskelig språk og svare på spørsmål bedre enn et menneske.
La oss så se for oss at vi kjøper IBMs Watson og programmerer den til å analysere litteratur. Da vil vi kanskje bli i stand til å analysere stilen og strukturen i en fortelling, sammenligne den med en database av andre stiler og fortellinger. Vi vil også kunne sammenligne fortellingen med sjanger teori. Så i teorien kan datamaskiner snart erobre studiet av litteratur, den menneskelige fortellingen. Dette er faktisk allerede i ferd med å skje gjennom book genome prosjektet ved University of Idaho. (se også booklamp.org). Book genome-prosjektet skanner bøker og sammenligner resultatene.