På Nasjonalbiblioteket har dei dei siste åra jobba med å lage eit såkalla språkkorpus som gjer at kunstige intelligensar, talemaskinar og omsetjingsprogram kan skjøne norsk. 

Eit språkkorpus er ei avgrensa mengde med tekst og/eller tale. Det kan til dømes vere alle aviser gitt ut i Noreg frå eit årstal til eit anna eller alle Dagsnytt 18-sendingane i eit visst tidsrom. 

Nasjonalbiblioteket sit på eit enormt språkkorpus, med alt dei har digitalisert av det som er publisert i Noreg gjennom tidene i aviser, bøker, radio og så vidare.

Fritt tilgjengeleg

No har dei brukt desse ressursane til å trene opp eit program for automatisk konvertering av norsk tale til tekst. 

Maskinlæringsprogrammet NB Whisper har ei betre forståing av norsk tale og norske dialekter enn liknande program som har vore utvikla fram til no. 

– Dette er eit viktig arbeid for å sikre at kunstige intelligensar, språkmodellar og reiskap for alt frå helse til utdanning fungerer på norsk i framtida, seier nasjonalbibliotekar Aslak Sira Myhre.

Les mer.

Kilde: forskning.no


Annonse:

Servicekonferansen 2023: Spor F - Er digitalisering og KI svaret i dokumentasjonsforvaltning?

Hva skjer, dersom en nasjon ikke har orden på hukommelsen sin? Hvis den er full av hull, og du ikke kan finne svar på hva som skjedde i din sak?

Hva er det viktig å ta vare på av den enorme mengden data som skapes av oss og lagres om oss?

Hvordan gi tilgang til data, og samtidig sikre personvernet?

Få innblikk gjennom innlegg fra tre meget kompetente foredragsholdere 20.10 på Service- og tjenestekonferansen 2023.

Inga Bolstad, riksarkivar, har hovedinnlegget på spor F. Foto: Vegard Breie
Inga Bolstad, riksarkivar, har hovedinnlegget på spor F. Foto: Vegard Breie

Hvordan ta vare på nasjonens hukommelse når den er full av hull?

Hva skjer, dersom en nasjon ikke har orden på hukommelsen sin? Hvis den er full av hull, og du ikke kan finne svar på hva som skjedde i din sak – om pensjonen, helsehistoriene eller tomtegrensen?

Det bekymrer riksarkivar Inga Bolstad – for vi arkiverer slett ikke alt vi skal ta vare på.

Men mye blir tatt vare på – og hvordan sørger vi for at det ligger trygt for ettertiden? Og hvordan finner vi fram i milevis med materiale? Hvilke løsninger trenger vi?

Maria Astrup Hjort ledet Utvalget for digitalt skapt dokumentasjon. Foto: Det juridiske fakultet
Maria Astrup Hjort ledet Utvalget for digitalt skapt dokumentasjon. Foto: Det juridiske fakultet

Arkivering: Fra digital verkebyll til effektive løsninger

Mengden data som skapes av oss og lagres om oss, har aldri vært større. Hva er det viktig å ta vare på for ettertiden? Maria Astrup Hjort ledet Utvalget for digitalt skapt dokumentasjon, som leverte sin rapport 15.05.23. Har hun og resten av utvalget funnet løsningen på Arkivverkets digitale verkebyll?

Synnøve Standal er leder for Dokumentasjonssenter i Lillestrøm kommune. Foto: Andreas Krogset Dalene
Synnøve Standal er leder for Dokumentasjonssenter i Lillestrøm kommune. Foto: Andreas Krogset Dalene

Offentlig journal: KI gjør informasjon tilgjengelig på en trygg og effektiv måte

Åpenhet er viktig! Lillestrøm kommune bruker kunstig intelligens (KI) for å kvalitetssikre offentlig journal. Det sikrer et godt personvern og gjør at kommunen kan fulltekstpublisere på en tryggere måte.

Synnøve Standal er leder for Dokumentasjonssenter i Lillestrøm kommune, og gir innblikk i kommunens arbeid.

Videohilsen fra Synnøve