Annotation de données et apprentissage actif

Nous avons tous entendu dire que “les données sont le nouveau pétrole”. Cependant, tout comme son prédécesseur le pétrole, les données n’ont aucune utilité tant qu’elles ne sont pas traitées. Une étape de traitement souvent nécessaire pour les données non structurées (texte, images, fichiers audio et vidéo, par exemple) est l’annotation de données. En général, cette étape est effectuée manuellement, peut nécessiter l’intervention d’experts hautement qualifiés dans leur domaine (par exemple des ingénieurs, des médecins, etc.) et constitue l’un des principaux obstacles à la démocratisation de l’IA en raison du temps et des coûts que cela implique.

Et si nous pouvions faire appel à l’IA pour aider à l’étiquetage de données ? C’est la solution proposée par l'”apprentissage actif” : faire en sorte que le modèle d’apprentissage lui-même demande des étiquettes pour les données qu’il juge les plus utiles pour son entrainement.

Une boucle d’apprentissage actif pour économiser du temps et de l’argent sur l’annotation de données

Ce webinaire débutera par la présentation de la théorie de l’apprentissage actif par Olga Petrova, ingénieur en Machine Learning chez Scaleway. Nous apprendrons ensuite comment Kairntech travaille à exploiter l’apprentissage actif et le pré-étiquetage automatique pour offrir une expérience utilisateur supérieure et des économies substantielles à ses clients qui ont besoin d’annoter des données pour des tâches de NLP. Enfin, nous discuterons des besoins en matière d’infrastructure pour que tout cela se fasse de manière rentable et évolutive sur le cloud.

Jeudi 17 décembre 2020 à 17h30

Pour s’inscrire, cliquer ici.