Le verbatim client

Dans un environnement très concurrentiel, connaître les irritants et les attentes de ses clients est devenu un enjeu majeur pour toutes les entreprises. De nombreux indicateurs permettent de les cerner mais parmi ceux-ci, le « verbatim client » tient depuis l’apparition d’internet, une place de plus en plus importante. Qu’il résulte d’un enregistrement converti en texte, d’un commentaire issu d’une enquête marketing, d’un envoi direct par le client lui-même sur le site de la société ou encore d’un tweet, il représente la voix du client par excellence car il est sans filtre et sans le biais d’une interprétation quelconque.

Quels sont les enjeux de l’analyse de verbatim client ?

Les principaux enjeux sont de :  

  • diminuer le taux d’attrition en comprenant les irritants des clients et en prenant les mesures adéquates… avant qu’ils ne partent,
  • augmenter les ventes – par exemple de cross selling – en anticipant les attentes des clients,
  • améliorer l’expérience client avec la marque ou l’enseigne,
  • apporter plus de valeur dans le service rendu.

Difficulté de l’analyse de verbatim

La difficulté de son analyse provient, bien sûr, de la nature de la donnée (texte libre), du nombre de verbatim que reçoivent maintenant toutes les sociétés, de la variété des commentaires, de leur évolution dans le temps, de leur dépendance à la langue et à la culture auxquelles ils se rattachent. Une lecture humaine peut être envisagée mais trouve rapidement ses limites dès que les volumes à analyser sont importants (de quelques centaines à quelques dizaines de milliers par mois pour de grands groupes). Des traitements automatiques ont donc été mis en place ces dernières années en utilisant les technologies du NLP (Natural Language Processing ou Traitement Automatique des Langues) qui ont par ailleurs connu des avancées remarquables ces 18 derniers mois.

Solutions utilisées pour l’analyse automatique de verbatim

Pour les grands groupes, la solution a été souvent le recours aux quelques agences spécialisées dans l’analyse d’opinion (BVA, Sofres, Médiamétrie, etc…) ou à quelques spécialistes du parcours client. Ces agences disposent de suffisamment d’analystes en “Customer Experience” pour faire face à ces volumes et ont développé des traitements automatiques dont les coûts ont été amortis grâce aux volumes à traiter.

Pour tous les autres, la seule solution possible consistait à s’équiper de logiciels utilisant des méthodes purement statistiques associées à de la recherche par mots clés ou plus récemment à une analyse sémantique utilisant des modèles linguistiques généralement à base de règles.

Les limites de ces approches

Il en résultait :

  • La détection de tendances assez générales, pour les solutions statistiques ou à base de mots clés ne permettant pas une analyse très précise.
  • Des solutions assez pertinentes pour les modèles linguistiques à base de règles, développées par les linguistes informaticiens, mais souvent chères à l’utilisation car leur mise au point est délicate et dépendante de chaque langue. Enfin, toute modification des critères à analyser nécessite des développements spécifiques effectués la plupart du temps par un intervenant extérieur, souvent le fournisseur de la solution utilisée.

En quoi l’IA aujourd’hui constitue-t-elle une réelle innovation dans ce domaine?

D’abord en proposant des algorithmes très performants, comme ceux à base de réseaux de neurones, tous accessibles en «open source». Toute entreprise peut les utiliser.

Ensuite parce qu’il est possible d’utiliser des modèles de langage pré entraînés pour mieux comprendre la “langue” des verbatim. Ces modèles peuvent être entraînés sur des grandes quantités de verbatim monolingues ou multilingues existant sur Internet ou détenus par les clients eux-mêmes ou les agences d’opinion (qui disposent d’importants volumes dans leurs archives). Ces modèles de langage pré entraînés permettent au final de gagner en qualité de manière significative. 

Enfin parce qu’avec l’IA, le plus difficile est de disposer d’un jeu de données d’apprentissage. Dans notre cas, le point de départ est déjà de disposer d’un ensemble suffisant de verbatim clients ce dont toutes les entreprises disposent. Ensuite, annoter un verbatim est à la portée de tout analyste spécialisé en “Customer Experience”. Il faut uniquement une bonne connaissance du « parcours » de son client et un peu de bon sens pour poser une ou plusieurs annotations sur chaque verbatim afin de créer au final un jeu d’apprentissage sur lequel la machine va pouvoir apprendre.

Or, il existe aujourd’hui des outils simples et faciles à utiliser par les analystes, ne demandant aucune connaissance en matière de programmation. Ce sont donc les analystes qui construisent et évaluent eux-mêmes leur solution de classification de verbatim en utilisant les algorithmes les plus avancés tels que les réseaux de neurones. 

Comment l’analyste procède-t-il en pratique ?

L’analyste en “Customer Experience” doit dans un premier temps définir l’ensemble de ces catégories ou “étiquettes”. Il peut le faire soit grâce à son expérience soit suite à l’exploration de l’ensemble des verbatim. Il pourra revenir sur la définition de ces étiquettes même une fois le travail de constitution du jeu de données d’apprentissage commencé :

L’analyste va également définir les étiquettes pour identifier le sentiment.

Puis l’analyste commence à classer quelques verbatim dans chacune des catégories définies. Les verbatim peuvent être avantageusement segmenter pour pouvoir travailler à un niveau plus fin que sur le verbatim lui-même. L’analyste s’attachera à affecter idéalement un sentiment à chaque thématique.

Ce travail peut être long et fastidieux s’il est effectué manuellement.

Que peut faire l’IA pour aider l’analyste à créer des exemples plus rapidement dans chaque catégorie ?

Dès la création de quelques exemples, l’IA peut commencer à apprendre et à suggérer des exemples que l’analyste devra valider, corriger ou rejeter. Ainsi ce dernier gagnera du temps ou pourra facilement sous traiter cette tâche le cas échéant.

Une fois que l’analyste aura constitué un jeu de données représentatif, il pourra contrôler sa qualité, par exemple la bonne distribution des catégories.

Une fois ces verbatim annotés, l’analyste voudra trouver le meilleur algorithme fournissant la meilleure qualité possible pour classer automatiquement de nouveaux verbatim. Ainsi il souhaitera tester différents algorithmes parmi les plus performants du marché, et adaptés à sa problématique (classification de texte dans ce cas), tels que Spacy, sklearn, Flair… Deux modèles peuvent être créés dans un même projet. L’un pour identifier la thématique du verbatim, l’autre pour identifier le sentiment attaché.  

Il pourra entrainer ces algorithmes puis les tester sur son jeu de données et finalement comparer leur qualité respective et ce… catégorie par catégorie :

Il faut souvent affiner les résultats en modifiant les paramètres des algorithmes, c’est le domaine réservé des Data Scientists et des spécialistes de l’IA.

L’analyste en “Customer Experience”, lui, pourra affiner son jeu de données sur telle ou telle catégorie et procéder à nouveau à une phase d’expérimentation.

La dernière étape consiste à mettre le modèle ainsi créé en production. Ce dernier pourra classer automatiquement le flux de verbatim sur les thématiques et les sentiments sans intervention humaine avec environ 95% de qualité, c’est-à-dire une qualité supérieure à ce qu’un être humain produit.

Restitution des résultats dans un portail de “Customer Experience”

L’exemple ci-dessous présente la restitution d’une analyse automatique dans le portail BVA CX Insights. L’objectif est de donner accès au client final aux résultats en lui fournissant : 

  • un tableau de bord interactif en ligne,
  • des statistiques sur les thématiques & sentiments extraits automatiquement à partir des verbatim pour fournir de l’aide à la décision (piste d’amélioration, formation de conseillers…)
  • accès aux verbatim

Conclusion

L’IA offre de nouvelles possibilités en matière d’analyse du parcours client. En particulier, elle permet aux PME d’utiliser ces contenus et de les valoriser. Les solutions sont simples, efficaces et peu chères.

Mais c’est aussi le cas pour les grandes agences mentionnées plus haut. Seules celles qui prendront le virage de l’IA à l’avenir resteront compétitives et seront capables d’offrir les nouveaux services que leurs clients leur demanderont.