Fremtidens historikere lærer også at bruge Transkribus

Af Kristian Pindstrup

Onsdag den 14. september var en årgang på ca. 100 studerende fra historiestudiet på Aarhus Universitet forbi Aarhus Stadsarkiv for at lære om Transkribus, Retro-projektet og kommunale arkivalier i almindelighed. Arrangementet er en del af et større forløb om arkiver og digitale tilgange til historie, som er blevet fast inventar på historiestudiets teoriorienterede metodefag på 3. semester, siden forløbet blev indført i 2019. Det klæder dem på til en digitaliseret fremtid, hvor det som historiker er nødvendigt at kunne arbejde med gamle kilder på nye måder og at kunne analysere og behandle store, ustrukturerede datamængder.

Hvor Aarhus Stadsarkiv i de forgangne år har assisteret universitetet i undervisningen i Transkribus, var det i år os, der stod for at lære de studerende at bruge Transkribus. I lighed med forårets workshops gav Mia Gulvad Jørgensen en kort indføring i Retro-projektet, og hvorfor det er vigtigt at digitalisere og transskribere de håndskrevne arkivalier, hvorefter de studerende udførligt blev introduceret for Transkribus, inden de selv skulle prøve kræfter med programmet.

Et gennemgående tema for forløbet har alle årene været kilder fra besættelsestiden, og i år fik de lov til at transskribere de første 10 sider efter 9. april 1940 i sognerådsprotokollen fra Hjortshøj-Egaa. Øvelsen skulle blandt andet vise, hvor langt teknologien indenfor tekstgenkendelse er kommet, men den skulle også især vise dem, hvilket imponerende arbejde der ligger i at skabe de store tekstmængder, der får genkendelsesmodellerne til at virke. For selvom de studerende gik til øvelsen med stort engagement, og selvom det også lykkedes for flere at knække koden til at læse håndskrift, så måtte en del også sande, at evnen til at læse ældre håndskrifter er noget, der skal læres, og at det tager tid at klargøre og transskribere blot en enkelt side. Det understreger også nødvendigheden af Retro-projektet, fordi evnen til overhovedet at læse de gamle håndskrevne kilder så småt er ved at forsvinde og er en udfordring selv for dem, der skal beskæftige sig med kilderne professionelt.

Der blev derfor også lejlighed til at afprøve tekstgenkendelsen, hvor modellen Danish 1870-1950 v3.5 var perfekt til lejligheden. Og dog – for selvom det er en meget solid mode,l og den er særligt stærk i netop den tidsperiode, hvor protokollen er fra, så er den ikke fejlfri. Det er derfor også en væsentlig lære, at man ikke kan stole blindt på teknologiske løsninger, men at man er nødt til at kende deres begrænsninger for at kunne bruge dem effektivt. Modellen giver et godt første udkast, og hvis man blot skal danne sig et overblik over et dokument, kan det alene være en stor hjælp. Men når man har brug for den præcise ordlyd, eksempelvis når den præcise tolkning er nødvendig i en historisk undersøgelse, så er det også vigtigt, at man selv kan identificere og rette de steder, hvor modellen ikke har ramt plet. I den kyndiges hænder er det derfor et godt værktøj, der kan gøre transskriberingen og kildeanalysen hurtigere, men før vi har nået det næsten perfekte stadie for tekstgenkendelse, er det stadig nødvendigt at holde evnen til at læse håndskrift ved lige.

Forhåbentligt har arrangementet hjulpet med at tænde nysgerrigheden hos den kommende generation af historikere og vist dem, at de håndskrevne kilder ikke behøver at være en utilgængelig ressource.

Skriv kommentar