La conférence > Conférenciers invités

La conférence SFC 2015 proposera 3 sessions plénières lors desquelles 3 conférenciers invités nous feront part de leurs travaux:

Jean-Loup Guillaume

Jean-Loup Guillaume est professeur à l’université de La Rochelle et mène ses recherches au Laboratoire Informatique, Image et Interaction. Il est spécialiste de l’analyse de réseaux sociaux et plus particulièrement des problèmes de détection de communautés dans des réseaux complexes et dynamiques. Il dirige le Réseau National des Systèmes Complexes.

http://jlguillaume.free.fr/www/

Titre de la présentation: Communautés multi-ego-centrées

Résumé: L’explosion de la taille des réseaux complexes tels que Facebook ou Wikipedia offre de nouvelles opportunités d’établir de nouveaux contacts et de partager de l’information et des savoir. L’excès d’information peut cependant être également néfaste : sur Facebook, à quels contacts envoyer un message sachant que la plupart des utilisateurs ont plusieurs centaines d’amis ? Quelles pages Wikipedia faut-il lire en priorité pour apprendre le plus possible sur un sujet donné. Ces deux exemples illustrent deux problèmes classiques en analyse de réseaux complexes et en fouille de données : la détection de communautés et le problème de classement. Les communautés sont des groupes de sommets fortement connectés et les approches classiques peuvent se classer en plusieurs groupes : 

- Les méthodes de partitionnement pour lesquelles les sommets appartiennent à une unique communauté. Cette vision est facilement compréhensible, mais reste limitée car, dans la plupart des contextes, les sommets appartiennent à plusieurs communautés ;
– Les méthodes recouvrantes qui sont beaucoup plus proches de la réalité, mais qui posent en pratique de nombreux problèmes de définition et de calcul ;
– Les méthodes ego-centrées, ou locales, qui se limitent à la recherche des communautés d’un sommet et sont donc un compromis plus accessible à l’heure actuelle.
Cette conférence présentera des réflexions sur cette troisième approche. En particulier, afin de contourner les problèmes classiques des fonctions de qualité, deux fonctions de proximité, une basée sur la dynamique d’opinion et la seconde basée sur la proximité topologique, seront exposées. Toutes deux permettent d’identifier rapidement les sommets proches d’un sommet d’intérêt et elles ont chacune un intérêt spécifique selon l’application recherchée. L’exposé sera complété par une présentation du concept de communauté multi-ego-centrée, c’est-à-dire de communauté centrée sur un ensemble de sommets. Il est possible avec les fonctions de proximité introduites de répondre à deux problèmes proches : (i) comment identifier la communauté contenant un ensemble de sommets fixés et (ii) comment extraire toutes les communautés autour d’un sommet. Des éléments de validation seront illustrés sur différents jeux de données, notamment un ensemble de pages Wikipedia. 

Michel Grosseti

Michel Grosseti est sociologue, directeur de recherches au CNRS et directeur d'études à l'Ecole des Hautes Etudes en Sciences Sociales. Ses activités de recherche actuelles portent notamment sur les dynamiques de l’activité et des formes sociales, les réseaux sociaux, les relations science-industrie et la géographie des activités scientifiques. 

http://w3.lisst.univ-tlse2.fr/cv/grossetti_michel.htm

Titre de la présentation: Réseaux et collectifs : deux formes sociales en interaction

Résumé: La communication partira de la distinction entre deux formes sociales. La première est celle du réseau constitué de liens dyadiques entre des personnes ou des organisations, une forme sans frontière ni partage de ressources par l’ensemble des entités impliquées. La seconde forme, celle du collectif, implique à l’inverse un partage de ressources définissant un intérieur et un extérieur, même si c’est de façon fluctuante et floue, et donc ce qui s’apparente à une frontière. Les deux formes sont en interaction permanente : les liens dyadiques se forment très souvent au sein de collectifs avant de s’en autonomiser ; les collectifs émergent souvent de configurations de réseaux. La communication présentera diverses dynamiques de constitution des liens de réseau et d’émergence des collectifs.

Gilbert Saporta

Gilbert Saporta est professeur émérite de statistique appliquée au Conservatoire National des Arts et Métiers. Il est expert en analyse de données multivariées. Il est auteur de très nombreux articles scientifiques et d'ouvrages en analyse de données et statistique  dont notamment « Probabilités, analyse des données et statistique ».  Il a présidé la Société Française de Statistique et  l'International Association for Statistical Computing.

http://cedric.cnam.fr/~saporta/

Titre de la présentation: Les méthodes « clusterwise » : principes et applications

Résumé: Les méthodes « clusterwise » autrefois appelées « typologiques » consistent à optimiser simultanément une partition des unités statistiques et des modèles locaux. La régression clusterwise en est le cas le plus connu : dans chaque classe on ajuste un modèle de régression et l’affectation aux classes se fait selon le meilleur modèle. Les méthodes clusterwise permettent de tenir compte d’une hétérogénéité non directement observable et sont particulièrement utiles pour les grands ensembles de données où la pertinence d’un modèle simple et global est contestable.

Les algorithmes classiques de type k-means optimisent de façon alternée appartenance aux classes et modèles. On peut également utiliser des modèles de mélange ou de classes latentes. Une extension consiste à utiliser pour chaque classe (région de compétence) le modèle le plus adapté parmi différentes classes de modèles au lieu d’estimer classe par classe des modèles semblables.

Les méthodes clusterwise fournissent évidemment de meilleures prévisions en apprentissage, mais leur complexité doit être maitrisée pour être appliquée à de nouvelles données.

On présentera des exemples d’application en régression et classification supervisée pour des données standard, des données fonctionnelles et des données où les variables sont structurées en blocs.

Personnes connectées : 1