2000 danskeres dialekter skal forbedre stemmestyrede hjælpemidler

14. SEP 2024 • 11:57INDLAND/KRIMINAL

Voicebots og andre stemmestyrede værktøjer trænes til at genkende dialekter som sønderjysk og bornholmsk.

Flere end 2000 danskere har over de seneste to år afgivet deres stemmer til et projekt, der skal forbedre teknologi til talegenkendelse.

Det skriver Alexandra Instituttet i Aarhus, der er en af parterne bag projektet, i en pressemeddelelse.

Det er blevet til 375 timers optagelse med danske dialekter fra Skagen til Gedser og Bornholm til Blåvandshuk.

- Det betyder, at alle de teknologier, som begynder at komme frem, vil kunne fungere langt bedre.

- Det kan være voicebots i kundeservices eller behandling af lyddata, som bliver brugt i det offentlige til automatisk at skrive journalnoter, siger senior AI specialist Dan Saattrup Nielsen i meddelelsen.

De hidtidige taledatasæt har typisk bestået af tale fra personer fra de større byer.

Det betyder, at teknologiske hjælpemidler, der benytter talegenkendelse, ikke har lært danske dialekter.

- En af de unikke aspekter ved datasættet er, at det har en bred repræsentation af hele landet, hvor de datasæt, der tidligere har været udgivet, har været relativt små.

- Og det har typisk været unge mænd fra storbyen, der indgår i datasættene, siger Dan Saattrup Nielsen.

Det er eksempelvis såkaldte voicebots, der benytter talegenkendelse. Teknologien bruges også i hjælpemidler, der kan forvandle det talte ord til tekst.

Forskerne er ikke i mål endnu. Ambitionen er at komme op på 1000 timers taledata.

Projektet er et samarbejde mellem Alexandra Instituttet, Datalogisk Institut på Københavns Universitet og Digitaliseringsstyrelsen.

Det samlede budget er på 22 millioner kroner, hvoraf mere end halvdelen kommer fra Innovationsfonden.

Alle data og modeller i projektet er såkaldt open source. Det vil sige frit tilgængeligt for alle, fremgår det af pressemeddelelsen.

/ritzau/

MESTE LÆST INDLAND-KRIMINAL (48 T)

SENESTE RITZAU

FÅ ABONNEMENT