Transkribus

Une technologie de pointe : l’association image-texte et métadonnées #

Pour prendre en compte les caractéristiques textuelles et structurelles des documents, il est important de conserver l’association entre la transcription d’un document et son image. Pour ce faire, le projet Nouvelle-France numérique utilise le logiciel libre Transkribus, développé par la coopérative européenne READ (Recognition and Enrichment of Archival Documents), dont l’UQAR est le premier membre institutionnel nord-américain. Ce logiciel permet d’identifier, dans la transcription d’un document, les coordonnées pixel où apparaît chaque ligne de texte dans l’image qui leur est associée. Grâce à des algorithmes d’intelligence artificielle et à des modèles de reconnaissance de l’écriture manuscrite (HTR ou Handwritten Text Recognition) entraînés à partir d’un type d’écriture et d’une langue donnés, Transkribus effectue automatiquement la transcription des manuscrits numérisés.

http://nouvellefrancenumerique.info/collaboration-et-haute-technologie/

Powered by BetterDocs