Model til 1800-tallets gotiske håndskrift er på vej

Af Kristian Pindstrup

Det har været længe undervejs. Siden vi offentliggjorde en model for 1700-tallets gotiske håndskrift, som man kan læse mere om her, har vi forsøgt at træne en model, der også ville kunne håndtere gotisk håndskrift fra 1800-tallet. Med udgangspunkt i modellen for 1700-tallet begyndte vi at træne den sammen med forskelligt materiale fra 1800-tallet for at se, om det kunne lade sig gøre at lave én samlet model for 1700- og 1800-tallet eller om ikke andet at kunne bruge den ældre model som støtteben, indtil vi havde skabt og indsamlet nok materiale til at en model for 1800-tallet kunne stå på egne ben.

Det har gennemgående været en udfordring at finde nok materiale fra 1800-tallet. Hvor vores mange dygtige frivillige er blevet yderst kompetente i at transskribere skråskrift, så har det været sværere at finde frivillige til at transskribere det gotiske materiale, da det ofte kræver et særligt kendskab til håndskriften, som kun få har tilegnet sig. Enkelte har dog heldigvis meldt sig, og selvom det har været en krævende og ikke hurtigt løst opgave, så har vi løbende kunne bruge de transskriberede sider til at træne forskellige eksperimentalmodeller de sidste par år. Og efterhånden har vi nået en mængde i en størrelsesorden, som andre solide modeller har. En stor tak skal også lyde til lektor i historie ved Aalborg Universet, Johan Heinsen, der har stillet  godt og vel 300.000 transskriberede ord fra slutningen af 1700-tallet og starten af 1800-tallet til rådighed.

Sammen med træningsgrundlaget for 1700-talsmodellen er vi derfor nået op på næsten 1.6 millioner ord for eksperimentalmodellen – den samme mængde som har været grundlaget for Danish 1870-1950-modellen. Men efterhånden som vi har øget mængden af 1800-talsmateriale i det samlede træningsgrundlag, er det desværre også blevet tydeligere, at der er for stor forskel på træningsgrundlaget for de to århundreder til at man kan samle det i én model, selvom det måske ville kunne lade sig gøre med et endnu større træningsgrundlag, hvor forskellene ville blive udlignet. Eksperimentalmodellen har med dette træningsgrundlag opnået en fejlrate pr. tegn på omkring 10%. Det ville derfor kræve et stort manuelt arbejde at anvende modellen, og det er derfor ikke noget, vi ville kunne stå inde for at offentliggøre. Derfor har vores eksperimentalmodel også hidtil kun været forbeholdt enkelte, der har haft lyst til at afprøve modellen. Så vi besluttede os for at eksperimentere i en anden retning. Vi ville fjerne støttebenet og se, om vi havde nok materiale til at træne en selvstændig model for 1800-tallet.

Og det har vi. Med lidt under en million ord fra slutningen af 1700-tallet og indtil 1875 er det lykkedes at træne en model en fejlrate pr. tegn på 6.7%. Vi vil gerne længere ned, men det er dog pænt nok til at vi gerne vil dele den med den brede offentlighed, og derfor er den nu også offentligt tilgængelig og kan afprøves her. Det kræver dog fortsat en kyndig bruger at benytte modellen effektivt. Den vil lave fejl, og der er ingen garanti for, at den virker lige godt på alle typer gotisk håndskrift fra tidsperioden. Men forhåbentligt kan den hjælpe den allerede kyndige transkribent på vej, så transskriberingen går hurtigere. Og måske kan den også hjælpe nybegyndere på vej, som mangler det sidste skub for at lære at læse gotisk håndskrift. Under alle omstændigheder skal den dog bidrage til at skabe et større træningsgrundlag, så vi på sigt kan træne større modeller til gotisk håndskrift.

Arbejdet er hverken afsluttet eller blot begyndt. Men vi er godt på vej.

 

1 thought on “Model til 1800-tallets gotiske håndskrift er på vej”
  • Per Hofman Hansen says:

    Vil følge projektet med stor interesse

    12. maj 2023 at 9:11
Skriv et svar til Per Hofman Hansen Annuller svar