Information frigiver Tagger

Computere er dumme. Derfor er det svært for dem at binde indhold sammen, så det giver mening. Det betyder, at medierne har svært ved automatisk at trække relevant indhold ind fra forskellige kilder - og det gør det svært at aktivere de myriader af artikler, som ligger i arkiverne - for hvordan ved publiceringssystemet, hvornår det er relevant at hente en artikel frem?
MediaWatch

Computere er dumme. Derfor er det svært for dem at binde indhold sammen, så det giver mening. Det betyder, at medierne har svært ved automatisk at trække relevant indhold ind fra forskellige kilder - og det gør det svært at aktivere de myriader af artikler, som ligger i arkiverne - for hvordan ved publiceringssystemet, hvornår det er relevant at hente en artikel frem?

Det problem har Information forsøgt at løse ved at udvikle systemet Tagger med sparring fra Center for Sprogteknologi på Københavns Universitet.

Tagger kan scanne en tekst og finde sammenhænge baseret på prædefinerede nøgleordslister - på den måde kan Tagger gøre det lettere at systematisere nyheder og sætte dem i kontekst - og for at få så mange andre medier og indholdsproducenter med på vognen frigiver Information nu systemet som open source.

Semantisk tagging
På information.dk tagges alt indhold allerede ‘semantisk’ med Tagger. Mere end 40.000 artikler organiseres på den måde tematisk på emnesider og bliver herefter kædet sammen med relevante data fra Wikipedia, New York Times, Geonames, CIA Factbook og en lang række andre kilder.

Og nu skal Tagger gøre det muligt for andre medier at udnytte de samme muligheder - og samtidig åbne for at binde indhold sammen på tværs af medier.

"Tagger er utroligt ambitiøst projekt, men også et projekt, der løser en helt praktiksk udfordring, som rigtigtg mange medier sidder med i dag,” siger redaktionschef Nikolai Thyssen, som er primus motor bag projektet.

“Hvordan får vi mening ud af de kæmpemæssige datamængder, vi har liggende i vores arkiver? Det var sådan projektet blev til på Information - som et forsøg på at løse et praktisk problem. Det tagger vores indhold, så vi ved, hvilke tekster der handler om hvad, hvilke artikler der hører til hvilke temaer og hvilke fænomener, vi beskriver i
journalistikken. Det er et værktøj til at lave begavede sites. Men perspektivet i det er så meget større. For os handler det om at sætte nyheder i kontekst, at binde den bredere offentlighed sammen og give brugerne indsigt i emner, der ikke begrænser sig til det, vi selv har mulighed for at beskrive.”

»Det er derfor, jeg synes,, det er strålende at eksempelvis Ritzau er gået med i projektet. Et telegram fra Ritzau om f.eks. grænsekontrol kan ved hjælp af Tagger blive en nyhedsmotor, der aktualiserer vores journalistik og samtidigt kæde de vigtigste kilder sammen fra Folketinget og andre kilder. Det er grundlæggende set et godt værktøj til det, de på Guardian kalder åben journalistik,” siger han.

Men før Tagger for alvor bliver brugbart, kræver det kritisk masse. Er det muligt at gøre det til en branchestandard?

“Internet har igen og igen vist sin evne til at undergrave standarder, fordi udviklingen går så hurtigt. Så vi vil helst ikke være en standard, men hellere en åben platform, der kan udvikle sig løbende. Det er derfor, vi frigiver det som open source, så de, der bruger det, kan være med til at udvikle det. Når det er sagt, håber vi at få så mange med som muligt - det drejer sig på sin vis om at stille sin viden til rådighed som ressourcer for andre og jo flere, der gør det, des mere interessant er det naturligvis. I dag kan vi eksempelvis slå op i CIA Factbook, men for danske sites ville det jo svære sjovere, hvis man kunne slå op i Danmarks Statistik eller på folketinget.dk,” siger Nikolai Thyssen, som understreger, at projektet rækker videre end til mediebranchen.

Relevant for mange
“Det er relevant projekt for mange medier, men det bliver først rigtig interessant, hvis også andre typer vidensorganisationer melder sig. Jeg er utroligt glad for, at så forskellige organisationer som FDB og Dansk Biblioteks Center er med i projektet - det viser lidt om perspektivet.”

Giver det mening at lave den slags nationalt i lille Danmark?

“Det giver netop mening i Danmark. Der er kæmpe stor forskel på det dansk- og engelsksprogede internet, og der er en række strålende udviklinger, som aldrig bliver til noget i et lille sprogområde som det danske. Ligesom vi har lavet Tagger, har Thomson Reuters udviklet OpenCalais - et strålende projekt, som bare ikke fungerer på dansk. Det er også derfor, vi skylder stor tak til Center for Sprogteknologi for Københavns Universitet, for uden dem var det ikke blevet til noget herhjemme."

Projektet lanceres på et åbent møde i dag arrangeret af onlineforeningen DONA.

Del artikel

Tilmeld dig vores nyhedsbrev

Vær på forkant med udviklingen. Få den nyeste viden fra branchen med vores nyhedsbrev.

Nyhedsbrevsvilkår

Forsiden lige nu

Læs også