Ny teknik gör det lättare att analysera historiska dokument

By on 5 september, 2020

Teknik som gör att vi snabbare kan analysera handskrivna historiska dokument såsom kyrkböcker, domböcker och mantalslängder presenteras i en ny avhandling vid BTH. Nya metoder att analysera de många gånger svårtydda dokumenten presenteras också.

Idag är det lätt för allmänheten att komma åt äldre handskrivna dokument. De finns ofta som högupplösta bilder hos olika myndigheter och blir lättåtkomliga via internet. Behovet att analysera bilder och dokument är därför ett växande område och har fått mycket uppmärksamhet på senare år. Utvecklingen har framför allt drivits framåt av kraftfulla AI- och maskininlärningstekniker som neurala nätverk, även kallat ”deep learning”. Utmaningen med denna teknik är dock att det krävs mycket data för att träna nätverken och att de är beräkningskrävande.

Att analysera historiska handskrivna dokument är speciellt utmanande på grund av att texten kan ha blivit blekt, dokumentet skadat eller att text från baksidan syns igenom.

Florian Westphal har i sin avhandling i ämnet datorsystemteknik tittat på två utmaningar när det gäller ”deep learning”: dels hur beräkningarna kan göras mer effektiva, dels hur man kan göra själva träningen mer effektiv till exempel genom att inte träna på all data utan enbart träna vissa delar.

Florian Westphal har utvecklat tekniker och metoder som kan göra träningsprocessen nästan fyra gånger snabbare och att man kan reducera mängden träningsdata med upp till två tredjedelar – utan att noggrannheten går förlorad. Han har även tagit fram en metod där användaren ger återkoppling till systemet interaktivt under träningsprocessen för att effektivisera den.

Teknikerna som Florian Westphal har utvecklat är generella men här specialiserade för tillämpad analys av digitaliserade historiska handskrivna dokument, till exempel kyrkböcker, mantalslängder och domböcker.

Regionalt
Örebronyheter

Källa: Blekinge Tekniska Högskola

You must be logged in to post a comment Login