Please use this identifier to cite or link to this item:
https://scholarhub.balamand.edu.lb/handle/uob/2471
Title: | Reconnaissance de mots manuscrits hors-vocabulaire en utilisant des ressources web | Authors: | Oprean, Cristina Mokbel, Chafic Likforman-Sulem, Laurence Popescu, Adrian |
Affiliations: | Department of Electrical Engineering | Keywords: | Reconnaissance du texte manuscrit Dictionnaires dynamiques Wikipédia BLSTM |
Issue Date: | 2014 | Part of: | Revue document numerique | Volume: | 17 | Issue: | 3 | Start page: | 77 | End page: | 96 | Abstract: | É. Les systèmes de reconnaissance de l'écriture manuscrite s'appuient sur des dictionnaires prédéfinis obtenus à partir de corpus d'entraînement. La taille de ces dictionnaires résulte d'un compromis entre le taux de reconnaissance des mots du vocabulaire (DV) et leur couverture. Si la taille est petite, beaucoup de mots hors vocabulaire (HV) seront non reconnus. Pour améliorer la reconnaissance des mots HV, sans augmenter le dictionnaire statique, nous introduisons une étape supplémentaire qui exploite des ressources web. Après une classification des mots en DV-HV, Wikipédia est utilisée pour créer des dictionnaires dynamiques pour chaque mot HV. Un décodage final est effectué sur le dictionnaire dynamique afin de déterminer le mot le plus probable pour la séquence HV. Nous validons notre approche par des expériences menées avec un système de reconnaissance BLSTM sur la base RIMES. Les résultats montrent que des améliorations sont obtenues par rapport à la reconnaissance avec dictionnaire statique. |
URI: | https://scholarhub.balamand.edu.lb/handle/uob/2471 | Open URL: | Link to full text | Type: | Journal Article |
Appears in Collections: | Department of Electrical Engineering |
Show full item record
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.