L'exploration de données a pour but la découverte d'informations intéressantes, utiles ou profitables dans les très grandes bases de données. L'énorme croissance de la taille des bases de données scientifiques et commerciales actuellement disponibles, ainsi que la croissance aussi rapide des performances des ordinateurs font de l'exploration de données un domaine actif et stimulant. Les tâches principales, soient la discrimination, la classification et la recherche de relations ont été partiellement explorées en analyse de données, reconnaissance des formes, intelligence artificielle et autres domaines, parfois depuis un demi-siècle. Le défi réside toutefois dans la taille des problèmes considérés. En effet, là où l'on considérait des instances de problèmes avec quelques dizaines ou centaines d'entitées, les problèmes étudiés aujourd'hui en comptent des milliers et parfois des dizaines ou centaines de milliers, voire davantage. C'est pourquoi les méthodes traditionnelles sont revues et perfectionnées. Elles sont complétées par de nombreuses nouvelles méthodes.

La programmation mathématique joue un rôle clé dans cette entreprise. Elle impose la précision de l'énoncé de l'objectif poursuivi (e.g. le critère de classification ou la mesure de discrimination) ainsi que dans la formulation des contraintes imposées à la solution (e.g. trouver une partition, un recouvrement ou une hiérarchie). Elle prodigue aussi des outils mathématiques puissants pour construire des algorithmes exacts ou approchés très performants.

L'atelier sera l'occasion pour des pionniers de l'exploration de données et de la programmation mathématique, ainsi que de jeunes chercheurs prometteurs (et d'autres entre les deux classes d'âge) de se rencontrer et de discuter de grandes tendances et des développements de leur sujet. Les domaines principaux de l'exploitation de données seront considérés:

• La discrimination ou classification supervisée: construire une fonction qui sépare le mieux les bonnes et les mauvaises entités d'un ensemble donné, et classifie aussi correctement que possible de nouvelles entités.

• La classification automatique ou classification non supervisée: trouver des sous-ensembles d'une ensemble d'entités donné qui soient homogènes et bien séparés.

• Découvertes de relations: étant donné un ensemble d'entités et des mesures ou observations faites sur ces entités, trouver des relations satisfaites pour toutes, ou par la plus grande part, d'entre elles.