Ekstra Bladet laver AI-nyheder og vil bygge flere værktøjer til journalister
Ekstra Bladet har bygget en maskine, der helt automatiseret skriver hyperlokale nyheder om bl.a. årsregnskabet for den lokale håndværksvirksomhed, smiley-rapporten for bageren på torvet, eller hvad direktørens villa nede ved vandet er blevet solgt for.
Dertil har avisens udviklingsafdeling ved hjælp af den teknologi, som er kendt fra den meget omtalte chatrobot ChatGPT, forbedret det autogenererede indhold, og Ekstra Bladet pønser på at lancere flere nye værktøjer, som skal gøre hverdagen lettere for journalisterne.
Det fortæller Tore Rich, der har titel af content automation manager på Ekstra Bladet og er manden bag avisens seneste AI-satsning efter at have givet et indblik i udviklingen på konferencen Nordic AI In The Media Summit.
”Der er ingen tvivl om, at kunstig intelligens allerede har ændret måden, man laver journalistik på, og kommer til at gøre det endnu mere. Men de projekter, vi arbejder på, skal ikke erstatte journalisterne på nogen som helst måde, det skal hjælpe dem,” siger Tore Rich.
Tre typer nyheder
Kunstig intelligens er for alvor kommet på alles læber, siden chatrobotten ChatGPT kom på markedet i november sidste år. Siden har flere medier kløet sig i håret over, hvordan de kan implementere teknologien i deres arbejde.
I 2020 modtog Ekstra Bladet i samarbejde med CBS, DTU og KU 10,7 mio. kr. fra Innovationsfonden til at undersøge, hvordan kunstig intelligens kan udvikle medierne. Projektet løber frem til 2024, og de autogenererede nyheder er en del af projektet.
På Eb.dk kan brugerne klikke sig ind på sektionen ”lokale nyheder.” Her kan mediebrugeren indsætte sit postnummer, hvorefter vedkommende vil blive præsenteret for en række lokalnyheder fra området. Nogle af dem vil være skrevet af mennesker, mens andre er skrevet af kunstig intelligens.
Klikker man sig ind på artiklen, vil man blive mødt af informationen om, at det er en automatisk genereret nyhed. Skriver man Vejle Kommunes postnummer ind i sektionen, kan man læse historien om, at huset på Nobilisvej 3, som ikke har været til salg i 52 år, nu er blevet solgt for 1,5 mio. kr., og nyheden om, at et pizzaria på Koldingvej - igen - har fået en sur smiley af Fødevarestyrelsen.
Systemet trækker automatisk data fra offentlige styrelser og registre og henter automatisk billeder, for at generere regelbaserede nyhederne.
”Vi har været glade for at se, at teknologien bagved virker. Den finder data på nettet og laver artikler i et kontinuerligt flow, uden at der er nogen som helst inde over det. Og vi er glade for at se, at artiklerne i testperioden er blevet læst af en hel del brugere,” siger han, men afviser at dele konkrete læsertal.
GPT-teknologi
En ting er dog at beskrive, at en virksomhed har haft et underskud – noget andet er at forklare hvorfor. Til det benytter Ekstra Bladet forskellige versioner af den såkaldte GPT-teknologi fra den berømte chatrobot. Teknologien er groft sagt trænet ved, at den har ”slugt” store mængder af den tekstdata, der ligger på nettet, og ud fra den viden kan den så selv kreere tekster på et højt niveau – også på dansk.
Tore Rich har udviklet forskellige prompts – altså kommandoer – som skrives til GPT-modellen, hvor systemet bliver bedt om at skrive et resumé af en ledelsesrapport eller en smileyrapport. Resuméet fremgår så som en slags faktaboks i de AI-skrevne artikler.
”Processen kører fuldstændig automatisk, og så sidder der en og kigger på resultatet. I ledelsesrapporten er der ofte en forklaring på, hvorfor tallene ser ud, som de gør, så det er nyttigt at kunne tilføje det til artiklen,” siger Tore Rich.
Således fremgår det nu i en artikel, at et campingfirma har fået tilsagn fra sit pengeinstitut om finansieringen af driften, selvom selskabet har en negativ egenkapital, og at grunden til, at en restaurant i Rungsted fik en sur smiley, var, at Fødevarestyrelsen på sin kontrol konstaterede mangler i hygiejne og rengøring i kølerummet.
”Nu er vi færdige med at teste de automatiske lokale nyheder, og de bliver derfor flyttet væk fra forsiden. Nu skal vi tænke os om og finde ud af, hvordan vi udnytter de her mange muligheder bedst muligt. Det kan eksempelvis være i flere og nye typer af lokale nyheder – det vil vise sig hen ad vejen,” siger Tore Rich.
Han har en forventning om, at de automatiserede nyheder på sigt kan forløse et kommercielt potentiale.
”Når jeg taler med folk, der arbejder med automatiserede nyheder i Norge og Sverige, så hører jeg, at hvis man kan ramme folk meget præcist med indholdet, så er folk villige til at oprette et login og tegne et abonnement for at læse det,” siger han.
Fejl og nye overskrifter
Det er dog ikke hver gang, at teknologien rammer plet. GPT-teknologien har en tendens til at lave såkaldte hallucinationer – altså at lyve.
I 54 ud af 92 af af resumé-faktaboksene på Ekstra Bladet var resultatet tilfredsstillende i første forsøg har en intern analyse vist. Andre krævede to, tre eller fire forsøg. Enkelte gange krævede det mellem 11 og 12 forsøg, før det sad i skabet.
De hyppigste årsager til, at resuméet blev afvist, var, at der var fejl i, eller at de manglede vigtig information. Andre gange havde den kunstige intelligens fejlevalueret indholdet i fx ledelsesberetning eller decideret løjet. Derfor er der et ”human in the loop,” som Tore Rich formulerer det.
”Når man har en GPT-model inde over, så kan man ikke stole på det, der kommer ud. Derfor er man nødt til at have journalister eller redaktører inde over, som kigger på outputtet,” siger han. Derudover bruges teknologien til at lave bedre rubrikker ud fra informationerne i resuméerne.
Flere værktøjer til journalister
Som tidligere nævnt er det endnu ikke afgjort, hvad de autogenerede nyheders næste skridt skal være. Men Tore Rich løfter sløret for en række nye tiltag, som avisen pønser på at lave. Udviklingsafdelingen retter nu blikket mod at lave redaktionelle værktøjer, som kan bruges internt frem for output-værktøjer.
Et af de værktøjer kunne være at udvikle en chatrobot, som er trænet ud fra samtlige digitale artikler, Ekstra Bladet har publiceret.
”I dag, hvis man skal finde noget i arkivet, skal man lave en meget præcis standardsøgning. Vi vil gerne lave det sådan, at man kan spørge chatbotten ”Var det ikke noget med, at der var en minister, der engang gjorde X?,” og så skal den kunne svare ”Jo, Ekstra Bladet skrev om denne minister i de her artikler, og det handlede om det her,” siger Tore Rich.
”Det skal være en assistent, der kender til hele arkivet, og som kan være med til at gøre det meget mere brugbart og levende,” siger han.
Et andet muligt værktøj er en model, der automatisk skriver opsummeringer om live-begivenheder om eksempelvis fodboldkampe eller andre begivenheder, som Ekstra Bladet live-blogger fra, så den enkelte journalist skal bruge mindre tid på det.
Andre idéer er et værktøj, som kan pille vigtige punkter ud af rapporter på flere hundrede sider fra ministerier eller komme med bud på, hvilke spørgsmål der mangler at blive besvaret i en pressemeddelelse. Udviklingsafdelingen er i dialog med en række redaktionelle medarbejdere om, hvad det er, de efterspørger i deres hverdag.
”Vi har endnu ikke lagt os fast på noget, men de værktøjer, vi laver, skal hjælpe journalisterne. Vi vil gøre det så let som muligt for journalisterne at udnytte de her enorme kræfter,” siger Tore Rich.
Billigt at komme i gang
Selvom Ekstra Bladet i JP/Politikens Hus er del af en stor privat mediekoncern, og avisen har midler fra Innovationsfonden og hjælp fra flere universiteter i ryggen, mener Tore Rich ikke, at andre medier bør lade sig afskrække fra at komme i gang med at bruge kunstig intelligens aktivt.
”Først og fremmest bør man gå i gang med at eksperimentere. Find ud af, hvad teknologien kan, og hvad den ikke kan,” siger han.
Dertil bør man købe såkaldt api-adgang til GPT 3.5 og GPT 4-teknologien, mener han. Det giver mulighed for at bygge sin egen brugerflade op om teknologien, hvilket åbner for markant flere muligheder, end der er i den almindelige online-version af ChatGPT.
”Det er ikke voldsomt dyrt at komme i gang. Det, der koster noget, er den man power, det kræver at bygge det. For nogle kan det være svært at frigive de ressourcer, men man skal huske på, at det på den anden side frigiver ressourcer, hvis man kan optimere den journalistiske proces,” siger Tore Rich.
Relaterede artikler:
Ekstra Bladet udnævner ny udviklingsdirektør
For abonnenter