L'industrialisation des analyses - Besoins, outils & applications

Résumé. Le data mining est aujourd’hui de plus en plus utilisé dans les entreprises les plus compétitives. Ce développement, rendu possible par la disponibilité grandissante de masses de données importantes, pose des contraintes tant théoriques (quels algorithmes utiliser pour produire des modèles d’analyses exploitant des milliers de variables pour des millions d’exemples) qu’opérationnelles (comment mettre en production et contrôler le bon fonctionnement de centaines de modèles). Je présenterai ces contraintes issues des besoins des entreprises ; je montrerai comment exploiter des résultats théoriques (provenant des travaux de Vladimir Vapnik) pour produire des modèles robustes; je donnerai des exemples d’applications réelles en gestion de la relation client. Nous verrons ainsi comment il est possible d’industrialiser le data mining et en faire ainsi un composant facilement exploitable dès qu’on dispose de données.