Modeller til håndskriftsgenkendelse

Aarhus Stadsarkiv har udarbejdet en række modeller til genkendelse af hånd- og maskinskrift, nogle i samarbejde med andre parter, hvor flere af modellerne allerede kan benyttes i Transkribus. For hjælp til at bruge genkendelsesmodellerne i Transkribus, kan man læse vejledningen her. Enkelte modeller er også fremvist på READs hjemmeside, hvor man kan afprøve, om den specifikke model virker på ens materiale, ved at man uploader et enkelt billede af materialet.

Danish 1870-1950 V3.5

Dette er projektets hovedmodel, der kan håndtere et bredt udvalg af dansk skråskrift fra omkring overgangen fra gotisk til moderne skrift i 1870’erne med en generel fejlrate på omkring 4-5% pr. tegn. Den er primært trænet på sognerådsmateriale, samt materiale fra Det Kgl. Bibliotek. På grund af træningsmaterialets natur er den knap så stærk på tal, som den er på bogstaver og prosa. Der kan læses mere om modellen her. Man kan også læse om den på READs hjemmeside her.

19th century Danish Gothic handwriting v.1.1

Denne model er et produkt af længere tids eksperimenter, som man kan læse mere om i dette blogindlæg. Den er trænet på dansk gotisk håndskrift fra slutningen af 1700-tallet og frem til overgangen til moderne håndskrift i 1875 og har en generel fejlrate på 6.7% pr. tegn. Træningsmaterialet består først og fremmest af sognerådsprotokoller fra forskellige stads- og lokalarkiver i Retro-projektet. Lektor i historie ved Aalborg  Universitet, Johan Heinsen, har også bidraget med en større mængde materiale. Modellen er offentligt tilgængelig i Transkribus, og man kan afprøve modellen her.

18C Administrative Writing

Denne model er skabt i samarbejde med lektor i historie ved Aarhus Universitet, Nina Javette Koefoed. Den er primært trænet på protokoller fra 1700-tallet fra Møns tugthus, samt materiale fra modeller fra samme periode udarbejdet af henholdsvis det norske Arkivverket og lektor i historie ved Aalborg Universitet, Johan Heinsen. Med en fejlrate på 4-7% pr. tegn er den et solidt værktøj til at bearbejde gotisk håndskrift fra 1700-tallet. Der kan læses mere om modellen her. Man kan også afprøve den på READs hjemmeside her.

Danish gothic print 1859-1888 V4

Dette er en model til gotisk trykskrift, som er trænet på baggrund af vejvisere fra Aarhus fra perioden 1859-1888. Da denne model er beregnet til trykt skrift, vil den forventeligt kunne håndtere tekster fra en bredere periode end den angivne med en fejlrate på omkring 1% pr. tegn. Den kan tilsvarende anvendes som træningsgrundlag sammen med andet trykt gotisk materiale. Den kan også ses på READs hjemmeside her.