Tant de bibliothèques et d’algorithmes de Machine Learning…
Dans le domaine de l’apprentissage automatique, il existe une grande richesse d’approches bien étudiées pour divers problèmes d’apprentissage et les utilisateurs se retrouvent souvent dans l’embarras du choix lorsqu’ils doivent se décider pour un algorithme spécifique pour un problème donné. Les algorithmes peuvent différer de manière significative dans leur comportement d’exécution, leurs besoins en mémoire et en données et finalement leur qualité finale. Le choix précis du modèle le plus approprié peut varier d’une situation à l’autre : Ce qui semble être une bonne configuration lorsque les données sont abondantes et que le temps d’entrainement peut s’étendre sur plusieurs heures ne répondra pas à vos besoins si seuls quelques échantillons sont disponibles ou si un modèle de travail est nécessaire en quelques instants.
Il est donc judicieux de proposer un éventail d’algorithmes. Afin de permettre aux utilisateurs d’explorer différentes options et de comparer leurs avantages respectifs, il est souhaitable de veiller à ce que les différentes options acceptent leurs données d’entrainement dans le même format et fournissent leurs résultats dans le même format, de manière à ce que les résultats puissent être facilement comparés. La bibliothèque python scikit-learn, par exemple, propose une riche sélection d’algorithmes d’apprentissage à travers une interface de programmation uniforme, rendant relativement simples les expériences avec des approches telles que les arbres de décision, les bayes naïfs, les forêts aléatoires et bien d’autres. Cependant, les utilisateurs doivent encore être à l’aise pour écrire du code python et s’assurer que les données des différentes expériences se retrouvent dans un format similaire pour une comparaison ultérieure.
Un cadre d’expérimentation des modèles de Machine Learning
La plateforme Kairntech donne accès à divers puissants programmes d’apprentissage automatique, « cachés » sous une interface utilisateur simple et facile à utiliser, mais qui élimine en outre le besoin de s’engager dans la programmation. La plateforme Kairntech donne actuellement accès à une approche CRF (Conditional Random Field) simple et rapide (CRFSuite), ainsi qu’au logiciel Spacy et à Delft, un framework de Réseaux de neurones disponible dans le domaine public et conçu par Patrice Lopez, expert en Machine Learning chez Kairntech. En ajoutant de plus en plus de tels librairies, nous permettons aux utilisateurs d’expérimenter et de bénéficier de la librairie la plus appropriée à leur tâche sans avoir à se soucier de la nécessité de se plonger dans l’écriture de code ou des différentes conventions pour les installer, les employer et les entrainer.
Nous sommes actuellement en train d’ajouter Flair, une autre bibliothèque d’apprentissage profond. Nous sommes heureux de présenter ces nouvelles fonctionnalités dans la plateforme Kairntech sur le célèbre corpus Conll 2003 pour l’extraction d’entités nommées. La plateforme Kairntech permet d’effectuer de telles expériences de comparaison, ce qui permet de se rendre directement dans le cadre le plus prometteur.
La plateforme Kairntech assure le suivi des expériences sur un ensemble de données donné que les utilisateurs effectuent en utilisant différents algorithmes ou différents paramètres et offre des rapports détaillés sur les résultats respectifs. Et ce n’est pas sans une certaine satisfaction que nous constatons que le paquet de Delft mentionné ci-dessus s’avère assez compétitif sur les données de référence de Conll 2003 – voir le rapport ci-dessus.

Kairntech maintient des instances de la plateforme en ligne pour des tests, des démonstrations et des expériences. N’hésitez pas à nous contacter à l’adresse info@kairntech.com si vous souhaitez en savoir plus.