Contenu

Apprentissage et reconnaissance des formes et des situations

Pour certaines applications, on ne dispose que d’un niveau de connaissance minimal du système où les modes de fonctionnement sont décrits, non pas par un modèle, mais par des données expérimentales généralement entachées d’incertitudes. Il s’agit alors d’apprendre la fonction de décision à partir de ces informations. Les outils utilisés pour la résolution de ce problème dépendent de la nature des données, et émanent de thématiques scientifiques aussi diverses que les statistiques et l’intelligence artificielle. Si les efforts du laboratoire LM2S se concentrent essentiellement sur les méthodes stochastiques, qui constituent son cœur de métier, il lance également quelques investigations en IA afin d’élargir ses compétences.

Identification de systèmes dynamiques non-linéaires par méthodes à noyau : Dans le cadre des critères de marge classiquement utilisés dans les SVM, la taille de la matrice de Gram et le temps nécessaire à la résolution du problème d’apprentissage dépendent directement du nombre d’observations composant l’ensemble d’apprentissage. Il en résulte un coût calculatoire excessif et un espace de stockage prohibitif lorsque les données disponibles sont en quantité importante. Pour pallier ceci, nous avons récemment proposé des algorithmes reposant sur la résolution itérative de sous problèmes de taille plus faible que celle du problème initial. Pour les problèmes d’estimation ou d’identification en particulier, nous avons étendu ces algorithmes en vue d’un traitement en ligne des données, dans l’esprit des méthodes de filtrage adaptatif.

Modèle d’état et méthodes à noyau : Les méthodes d’identification/estimation de modèles d’état ont toujours suscité un vif intérêt depuis les travaux fondateurs de Wiener et Kalman-Bucy, et ont été générateurs de progrès dans de multiples domaines applicatifs, par exemple l’annulation d’écho et le débruitage, le traitement de la parole ou encore le suivi de cible. Cependant, une limitation sérieuse de ces techniques est la nécessité d’élaborer au préalable un modèle dynamique précis du problème. Ceci requiert conjointement une expertise avancée du domaine d’application ainsi qu’une bonne connaissance des techniques de modélisation. Dans ce contexte, nous envisageons la possibilité d’extraire des modèles d’état directement à partir d’un historique de données. Ceci nécessite de définir la famille de modèles dans laquelle évoluer, éventuellement à noyau lorsqu’un caractère non linéaire est souhaité, ainsi qu’un critère de performance. Evidemment, une telle approche ne pourra être compétitive lorsqu’un modèle performant est disponible pour le problème traité. Nous visons plutôt une approche générique à même d’être utilisée pour une large classe de problèmes.

Time-frequency learning machines : Nous avons récemment montré que les méthodes à noyau les plus diverses peuvent être mises en œuvre dans le plan temps-fréquence grâce à un choix approprié de noyau reproduisant, proposant ainsi le nouveau concept de « time-frequency learning machine ». Cette connexion ouvre de multiples perspectives dans le domaine de l'analyse des phénomènes non-stationnaires puisqu'elle permet d'accéder aux plus récentes avancées théoriques, méthodologiques et algorithmiques en matière de reconnaissance des formes et de théorie de l'apprentissage. Nous en sommes aujourd’hui à une application directe de ce concept, montrant comment effectuer une ACP, une AFD ou encore élaborer une machine à vecteurs supports dans le plan temps-fréquence avec un coût calculatoire réduit. Nous nous efforçons maintenant de dépasser ce stade en montrant en quoi le choix du plan temps-fréquence comme espace de représentation des données constitue un a priori susceptible d’améliorer, dans certains cas, les performances d’une méthode à noyau donnée.

Segmentation d'images : Dans ce contexte, nous développons de nouvelles méthodes permettant d'opérer la sélection automatique d'ensembles d'attributs robustes aux artefacts. Nous abordons ce problème sous l'angle de la classification de données étiquetées, dans un cadre SVM. Toutefois, le problème de la sélection d'attributs pertinents dans l'espace de représentation initial demeure, dans la mesure où il détermine le rapport information utile/bruit des données traitées. Ce problème a peu attiré l'attention de la communauté scientifique à ce jour, notamment pour ce qui concerne la sélection d'attributs en présence d’artefacts (dysfonctionnement de capteurs, données erronées…). La segmentation d'images texturées ou la détection de défauts dans des images texturées offrent un cadre riche et adéquat pour expérimenter l'efficacité de ce type de démarche. En effet, la texture est caractérisée par des propriétés locales mesurées sur un ensemble restreint de pixels voisins en raison de l'hypothèse de stationnarité. A la frontière entre deux textures (régions) ou au voisinage d'un défaut, la stationnarité est rompue, perturbant ainsi la mesure des propriétés locales. La qualité de la segmentation ou de la détection dépend alors fortement de la capacité des attributs à s'affranchir des artefacts. Pour cette raison, nous avons débuté ces travaux en recherchant le voisinage optimal d'un pixel reposant sur le calcul d'un critère de contraste. Les premiers résultats que nous avons obtenus ont montré que cette approche permettait d'atteindre des performances comparables aux approches classiques mais nous n'avons pas abordé le problème multi classes ni celui des images couleur. Pour la suite, nous visons donc à définir un processus de détection de frontières par la sélection du descripteur optimal (voisinage) de chaque classe (texture) au sein d'un ensemble de descripteurs obtenus par apprentissage. Il sera, entre autres, question de définir les critères d'optimalité dans le cas binaire, puis dans le cas multi classes.

Techniques d’intelligence artificielle pour la reconnaissance et l’anticipation de situations évolutives : Les projets de recherche développés jusqu’alors dans ce cadre ont porté sur la reconnaissance et l’anticipation de situations évolutives. Plusieurs méthodes d’intelligence artificielle ont été utilisées, principalement le raisonnement à base de règles, le raisonnement à partir de cas et les méta connaissances. Chacune de ces approches propose une reconnaissance de scenarii sur la base de modèles, représentant un ensemble de situations similaires. Nos recherches portent sur l’extension de la base de modèles de reconnaissance utilisés. La multiplicité de modèles, quelque soit la méthode de raisonnement utilisée, nécessite de les organiser et de les gérer. Les recherches futures porteront donc sur la gestion d’une base de modèles, qui devront permettre d’ajouter des modèles si la base de modèles disponible n’est pas suffisante au regard de la variabilité des situations susceptibles de se produire, en modifier afin qu’un modèle puisse toujours représenter un ensemble de situations, en supprimer si un modèle ne reflète plus les situations à reconnaître. Ce sujet de recherche est particulièrement important pour le raisonnement à partir de cas, car il a été peu abordé jusqu’à présent.