Please use this identifier to cite or link to this item: https://scholarhub.balamand.edu.lb/handle/uob/2471
Title: Reconnaissance de mots manuscrits hors-vocabulaire en utilisant des ressources web
Authors: Oprean, Cristina
Mokbel, Chafic 
Likforman-Sulem, Laurence
Popescu, Adrian
Affiliations: Department of Electrical Engineering 
Keywords: Reconnaissance du texte manuscrit
Dictionnaires dynamiques
Wikipédia
BLSTM
Issue Date: 2014
Part of: Revue document numerique
Volume: 17
Issue: 3
Start page: 77
End page: 96
Abstract: 
É. Les systèmes de reconnaissance de l'écriture manuscrite s'appuient sur des dictionnaires prédéfinis obtenus à partir de corpus d'entraînement. La taille de ces dictionnaires résulte d'un compromis entre le taux de reconnaissance des mots du vocabulaire (DV) et leur couverture. Si la taille est petite, beaucoup de mots hors vocabulaire (HV) seront non reconnus. Pour améliorer la reconnaissance des mots HV, sans augmenter le dictionnaire statique, nous introduisons une étape supplémentaire qui exploite des ressources web. Après une classification des mots en DV-HV, Wikipédia est utilisée pour créer des dictionnaires dynamiques pour chaque mot HV. Un décodage final est effectué sur le dictionnaire dynamique afin de déterminer le mot le plus probable pour la séquence HV. Nous validons notre approche par des expériences menées avec un système de reconnaissance BLSTM sur la base RIMES. Les résultats montrent que des améliorations sont obtenues par rapport à la reconnaissance avec dictionnaire statique.
URI: https://scholarhub.balamand.edu.lb/handle/uob/2471
Open URL: Link to full text
Type: Journal Article
Appears in Collections:Department of Electrical Engineering

Show full item record

Record view(s)

57
checked on Nov 24, 2024

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.