53.000 maskinlæste og transskriberede håndskrevne arkivalier på Aarhus Stadsarkiv – flere på vej!

Status på Retroprojektet: 2022-2023

Digitalisering og ikke mindst træning af modeller til tekstgenkendelse af vores håndskrevne kulturarv med machine-learning software er fremtiden inden for arkivverdenen. At kunne læse håndskrifter bliver i stigende grad en udfordring, og især de gamle gotiske skrifter er for de fleste en uoverkommelig opgave.

I 2017 kastede Aarhus Stadsarkiv sig ud i et storstilet machine-learning projekt, der om halvandet år skal munde ud i 100.000-vis af maskinlæste og transskriberede håndskrevne sider af vores alles historie.
Med fokus på at scanne, transskribere og maskinlæse sogne- og byrådsprotokoller fra forskellige egne af Danmark kom projektet Retrodigitalisering.dk rigtig godt i gang i 2021 med støtte fra Augustinus Fonden, VELUX FONDEN, Organisationen Danske Arkiver og Aage og Johanne Louis-Hansen Fonden.

Siden 2021 er også stads- og lokalarkiver fra hele Danmark kommet med i projektet efter kyndig oplæring i transskriberingsprogrammet Transkribus.
I Aarhus har vi dygtige frivillige tilknyttet projektet, der segmenterer, transskriberer, træner AI-modeller og korrekturlæser. Vi er stolte af, at vi allerede på nuværende tidspunkt kan præsentere 53.000 maskinlæste sider, hvoraf rigtig meget ligger tilgængeligt på projekthjemmesiden Retrodigitalisering.dk.

Og det er bare fra Aarhus! Vi har fået rigtig mange lokal- og kommunearkiver med fra hele landet, hvor der bliver digitaliseret, segmenteret, transskriberet og korrekturlæst på fuldt tryk.

Men vi er slet ikke færdige!

Her i starten af 2023 begynder det for alvor at tage fart, fordi maskinlæsningsmodeller kontinuerligt bliver trænet til at genkende vores gamle håndskrifter, jo mere vi får transskriberet. Jo bedre modellerne bliver, jo mere læsbar bliver vores fælles kulturarv, og derved bevarer vi adgangen til vores arkiver og baner vejen for at omdanne vores arkivdata til regulære datasæt og dermed åbne for fremtidige computerbaserede analyser.

Alle interesserede kan allerede på nuværende tidspunkt drage nytte af vores udviklede modeller i Transkribus. Se vores vejledning på hjemmesiden om hvordan man gør det.

Med andre ord, det summer af aktivitet fra engagerede frivillige og arkivarer, og alle arbejder hen imod, at vi kan bevare adgangen til og læsbarheden af vores fælles historie.
Kunstig Intelligens har meldt sin ankomst, og på Aarhus Stadsarkiv hilser vi fremtiden velkommen til bevaringen af fortiden.

Vi har stadig masser af plads til flere frivillige, der kan læse gotisk håndskrift, så tag endelig fat i os og hør nærmere.

Skriv kommentar