Nous revenons ici sur la question du «Speech to Text» ou reconnaissance vocale. Comme annoncé dans un précédent article de cette édition de la Newsletter, le programme HIJP a réalisé une analyse correspondante de marché. Divers produits et services qui prennent en charge les principales langues nationales suisses sont comparés en matière d'exploitation et de fonctionnalité ainsi qu’en termes de prix. Par ailleurs, il est examiné quelles sont actuellement les forces et les faiblesses des solutions en question en considérant les possibilités d’utilisation dans le domaine judiciaire.
Cas d’application dans le domaine judiciaire
Compte tenu de la simplicité de l’utilisation, en combinaison avec les résultats impressionnants en matière de transcription, les logiciels «Speech to Text» sont de plus en plus appréciés et de plus en plus présents pour s’acquitter de tâches administratives et de chancellerie. À bien des endroits, il n’est désormais plus concevable de se passer de telles solutions. Le retour en arrière, à savoir la saisie manuelle de textes depuis un dictaphone, n’est très souvent même plus une option.
Pour le programme HIJP, d’autres cas d’application sont toutefois en jeu. La question première est de déterminer si des solutions «Speech to Text» peuvent être utilisées judicieusement dans des situations où plusieurs personnes parlent, par ex. lors d’interrogatoires et d’audiences, ou quelle est la qualité lorsque l’élément fourni a un caractère régional, à savoir est prononcé en dialecte ou avec un fort accent.
Force est toutefois de constater que la maturité de la reconnaissance vocale automatique n’est pas encore suffisante dans de telles situations. Afin d'y remédier, les fournisseurs mettent tout en œuvre et s’efforcent de parvenir à une solution, notamment en coopérant avec des instituts réputés de recherche. Ainsi, le principal but d’utilisation de la reconnaissance vocale dans le domaine judiciaire est pour l’instant la saisie directe de contenus documentaires, ce qui remplace le dictaphone. L'avantage notoire est alors de pouvoir décharger les services administratifs.
Et qu’est-ce que cela signifie?
En ce qui concerne les exigences HIJP (reconnaissance de plusieurs orateurs), il n’y a donc pas de solution adéquate pour l’instant. Il s’ensuit que la direction de programme a décidé de renoncer pour l’heure à une exploitation test de «Speech to Text». Par ailleurs, les cas d’application standard (transcription directe, dictée) sont relativement peu intéressants dans le domaine HIJP. Cet état de fait justifie le fait de renoncer, jusqu’à nouvel avis, à effectuer des expériences pratiques avec cette technologie.
Malgré cela, les développements dans le domaine de la reconnaissance vocale seront suivis à distance, car les exigences HIJP spécifiques pourront être satisfaites par des solutions logicielles correspondantes dans un proche avenir.
Le rapport complet du marché peut être consulté.