Articles IT et Télécoms

La reconnaissance vocale au service des entreprises et des particuliers

Apparue dans les années 60, cette technologie s’est démocratisée une trentaine d’années plus tard avec l’apparition de solutions de dictée vocale ou des « kits mains libres » dans l’automobile par exemple. L’amélioration des technologies permet aujourd’hui d’envisager le déploiement de nouveaux services innovants.

 La reconnaissance vocale n’est pas (plus) un gadget. Profitant des avancées en matière d’Intelligence artificielle (IA), cette technologie séduit aujourd’hui de plus en plus d’entreprises.

Pour certains, la reconnaissance vocale est parfois mise au même niveau que la robotique dans les usines : à savoir une technique qui détruit des emplois. En réalité, qu’il s’agisse de la robotique (qui a, elle aussi, bénéficié des avancées obtenues en IA) ou de la reconnaissance vocale, ces deux technologies permettent d’améliorer la productivité des entreprises en fournissant de nouveaux services.

Des serveurs vocaux pour mieux gérer les appels

Pour les entreprises dont les salariés passent beaucoup d’heures au téléphone (service d’assistance pour la clientèle ou service commercial), les communications sont un poste souvent onéreux. A la suite du déploiement de systèmes de reconnaissance vocale efficients, il est possible de réduire la durée des appels. Le gain résultant peut être très significatif.

Il existe aujourd’hui des solutions de reconnaissance vocale qui sont simples d’utilisation pour les collaborateurs comme pour les appelants.

Il n’est en effet plus nécessaire de naviguer dans une arborescence de choix complexe : le client doit juste exprimer sa demande en « langage naturel » et c’est le système qui l’interprète pour la traiter. Pour les entreprises, ces technologies facilitent la mise en œuvre de systèmes optimisant le routage des appels afin que l’appelant puisse atteindre rapidement le bon interlocuteur.

Un système vocal efficace permet donc d’accéder au bon service. Néanmoins, il faut que le système mis en place soit correctement conçu et configuré de façon optimale, c’est-à-dire qu’il prenne en compte les principaux mots-clés propres à chaque domaine professionnel. S’il s’agit, par exemple, d’une société spécialisée en informatique, il doit intégrer des mots clés récurrents comme «logiciel», «mise à jour», «blocage»…

Une gestion intelligente des appels

Dans le cas d’une entreprise où les motifs d’appels sont très variés, la reconnaissance vocale et le langage naturel s’avèrent très efficaces.

En s’appuyant sur le langage naturel (une question ouverte est posée, par exemple : quel est l’objet de votre appel ?), de nouveaux systèmes sont capables de répondre à beaucoup plus de demandes clients et d’entamer des dialogues plus « naturels ». Dans ce domaine, Nuance s’impose comme le leader du marché.

A titre d’exemple, si le service clientèle d’un éditeur reçoit un appel d’une personne évoquant un « bug », l’analyse sémantique des propos de l’appelant va en déduire que sa requête est très probablement liée à un blocage du programme informatique. Le serveur vocal en conclura qu’il faut mettre rapidement la personne en contact avec un technicien du support qui tentera de la dépanner à distance, ou avec un technicien mobile si sa géolocalisation indique qu’il se trouve près du client.

La dictée vocale

Ce type de logiciels est très utile à tous les secrétariats qui doivent gérer de nombreux rapports très pointus, comme c’est le cas dans les secteurs médicaux et juridiques. En fonction du secteur d’activité, des dictionnaires professionnels spécialisés sont paramétrés pour prendre en compte les spécificités de l’entreprise.

La biométrie vocale pour plus de sécurité


Avec la multiplication des réseaux sociaux et des terminaux mobiles, les salariés possèdent de nombreuses identités numériques qui sont protégées par autant de mots de passe. Pour sécuriser ces informations personnelles, il convient de créer des mots de passe « forts », c’est-à-dire composés de lettres, de chiffres et de caractères alphanumériques, sans oublier de les modifier régulièrement. Autant de contraintes qui entrainent des oublis ou des erreurs. Pour résoudre ce problème, un système de biométrie vocale pourrait être intégré aux téléphones mobiles et aux ordinateurs. La voix d’un individu est en effet considérée comme unique.

Cette fonctionnalité est notamment intégré dans la solution « RSA Adaptive Authentication for Phone » (qui s’appuie sur un procédé de Nuance) qui propose aux banques une plate-forme d’authentification multifacteur permettant d´analyser différents critères de risque spécifiques aux transactions téléphoniques (numéro d´appel, empreinte vocale biométrique, profil comportemental, etc.).

À plus long terme, cette solution pourrait être également utilisée pour réinitialiser un mot de passe. Actuellement, lorsqu’un collaborateur rentre de vacances et qu’il doit changer le mot de passe de son ordinateur, il doit appeler la direction informatique qui va lancer différentes procédures pour vérifier son identité. Avec la biométrie vocale, ce sera beaucoup plus simple et rapide, tout en étant très efficace.

Les limites de la biométrie vocale

Il reste malgré tout encore beaucoup de progrès à faire dans ce domaine.

Contrairement à une idée reçue, on ne peut pas véritablement parler « d’empreintes vocales». Les caractéristiques du langage ne sont pas aussi fiables que celles des empreintes digitales ou génétiques pour deux raisons principales.

Premièrement, la voix évolue au cours de la journée, mais aussi selon les saisons et l’âge (sans parler de l’état de santé ou émotionnel). Deuxièmement, il s’agit d’un élément modifiable volontairement (imitateurs) et aisément falsifiable avec les moyens techniques existants.

« Dans le domaine vocal, les bases de données disponibles actuellement ne comportent pas un nombre suffisant de locuteurs, de langues, de conditions d’enregistrement pour évaluer la fiabilité des méthodes existantes dans un contexte d’authentification vocale », rappelle l’Association Francophone de la Communication Parlée (AFCP), créée en janvier 2002 par l’ensemble des membres de ce qui était alors le bureau du Groupe Francophone de la Communication Parlée de la Société Française d’Acoustique.

«Dans l’état actuel des connaissances, il n’existe pas de procédures, automatiques ou basées sur une « expertise », permettant d’avancer avec certitude qu’une personne est – ou n’est pas – l’auteur d’un enregistrement vocal », a rappelé cet hiver l’AFCP lorsque de nombreux médias ont désigné le programme Batvox de l’éditeur Agnitio comme « le logiciel qui a fait tomber » le ministre délégué chargé du Budget du Jérôme Cahuzac.

La biométrie vocale est donc prometteuse, mais pour l’instant, le bon vieux mot de passe a encore de beaux jours devant lui…

Les assistants personnels et autres applications de commande vocale destinées à l’utilisateur final


La reconnaissance vocale est également en train d’envahir le quotidien des utilisateurs à travers différentes applications qui vont des assistants personnels pour smartphones aux interactions avec des systèmes comme le Kinect de Microsoft.

Les assistants personnels constituent des outils présents sur les smartphones à l’instar de l’outil Siri sur iOS. L’application repose sur le traitement du langage naturel pour répondre aux questions, faire des recommandations et effectuer des actions en déléguant les demandes à un ensemble de services web.

Dans le cas du périphérique Kinect lié à la Xbox, il est possible de commander les services multimédia de la console en utilisant une combinaison d’ordres faisant appel soit à des mouvements du corps, soit à des commandes vocales ou une combinaison des deux.

Même si le fait est peu connu, un système comme Windows intègre de base un ensemble d’outils de commande vocale permettant d’interagir oralement avec le système (lancer des applications, dicter du texte sous Word ou dans un email, …).

On peut imaginer que Microsoft fera évoluer ces outils pour aboutir dans le futur à un nouveau type d’interface utilisateur qui repose sur une combinaison de gestes et d’ordres transmis par la voix de l’utilisateur.

Bref, que ce soit pour le fonctionnement de l’entreprise comme pour les interactions avec les nombreux outils numériques, on peut s’attendre à ce que les technologies liées à la reconnaissance vocale fassent très vite de plus en plus partie de notre quotidien.

Discussion

Les commentaires sont fermés.

%d blogueurs aiment cette page :