Programmes informatiques
Il est devenu impossible d’utiliser Kali sur les dernières versions de Jaws, même en installant Kali sous le nom de Sapi5. Sauf miracle, l’utilisation de Kali avec Jaws n’est plus d’actualité.
Il existe heureusement un autre lecteur d’écran, logiciel libre, NVDA, qui, de plus, fonctionne en 32 bits (même sur machine 64 bits), ce qui simplifie grandement les choses. L’interface NVDA-Kali permet aux deux logiciels de communiquer (voir téléchargements).
Le logiciel Kali, développé sous Windows, peut également être compilé sous Linux, pour la lecture d’écran ou pour des applications embarquées.
Deux applications Android pour déficients de la parole ont été créées. Elles se présentent sous la forme d’un clavier dédié, alphabétique pour l’une, phonétique pour l’autre, permettant de taper ses messages, de les mémoriser et de les oraliser.
Modèle pragmatique
Ce modèle réalise une prédiction des mots ou groupes de mots à mettre en relief ou au contraire entre parenthèses, en jouant sur la prosodie, afin d’améliorer la compréhension et le naturel des énoncés. Après la mise en relief, qui a atteint un taux d’erreurs inférieur à 4 %, nous avons travaillé sur la détection des parties parenthétiques, qui sont pour l’heure de trois types :
- l’expression par exemple en incise,
- les parties typographiquement entre parenthèses,
- les incises comportant un verbe de dialogue, avec, en français, inversion du sujet (ex : s’écria le professeur)
L’étude de textes lus devrait nous permettre d’enrichir les règles de détection des parties parenthétiques.
Analyse syntaxique
Deux méthodes complémentaires sont utilisées pour corriger les erreurs :
- l’analyse du corpus de travail, phrase par phrase,
- la recherche des mots absents de nos dictionnaires à l’aide d’une liste de mots classés par ordre de fréquence, extraite de gros corpus (> un milliard de mots).
L’effet des modifications est évalué très régulièrement sur notre corpus de test. Les corrections nécessitent parfois d’être modifiées ou complétées en cas d’effets secondaires.
Le bilan des erreurs d’analyse sur corpus donne les résultats suivants, rapportés au nombre de mots : 1 % d’erreurs de découpage (souvent perceptibles prosodiquement) et 4 % d’erreurs de relation (peu perceptibles) pour le français.
Pour l’anglais, le bilan est de 1,5 % d’erreurs de découpage et 4 % d’erreurs de relation. L’influence des erreurs de découpage est beaucoup plus faible qu’en français, l’accent de mot surpassant largement l’accent de frontière.
Transcription graphème-phonème
En français, des corrections continuent à être nécessaires, notamment sur des noms propres, des sigles, des mots d’emprunt et des mots valises. Derniers mots corrigés : Athos, Schuman, tiramisu, ABS, UEFA, Sollers, Haneke, Gunther, Gibson. Bilan total : le taux d’erreurs sur corpus est estimé à 1,02 % par mot (plus important sur les corpus journalistiques à cause du grand nombre de noms propres).
En anglais, le taux d’erreurs est estimé à 1,39 % par mot (soit une erreur tous les 72 mots, pas toujours perceptible), et concerne surtout des noms propres, des mots d’emprunt, des formes dérivées rares voire néologiques. Le résultat est maintenant jugé satisfaisant.
Modèle prosodique
En 2023/2024, plusieurs dizaines de contours prosodiques parenthétiques ont été prélevés en français et en anglais afin de nourrir les parties détectées comme parenthétiques.
En français, le nombre de contours atteint 603 et leur taux d’utilisation sur corpus est de 82 %, ce qui signifie qu’en moyenne, 82 % des groupes prosodiques d’un texte trouvent un contour qui satisfait à leurs caractéristiques pragmatiques, syntaxiques et rythmiques. Les 18 % restants utilisent par défaut la prosodie normalisée. L’expérience montre que des contours normalisés insérés entre les contours naturels passent généralement inaperçus. Le taux d’utilisation atteint par les contours naturels et la qualité des contours de remplacement donnent maintenant un résultat pleinement satisfaisant, ne nécessitant plus de nouveaux prélèvements.
En anglais, le nombre de contours atteint 633 et leur taux d’utilisation sur corpus est de 67 %, nettement au-delà de l’objectif minimal de 50 %, bien que le modèle naturel de l’anglais nécessite davantage de contours prosodiques que celui du français car la présence d’accents de mot augmente considérablement la combinatoire. La qualité atteinte ne nécessite pas de nouveaux prélèvements.
Bases de diphones
Après des améliorations de moins en moins perceptibles jusqu’en 2020, la synthèse par diphones a atteint ses limites. Les bases de diphones en français et en anglais sont considérées comme terminées.