logo_utm.jpg (10280 octets)Retour sur la page du site.                  

Pour avoir une version imprimable.      

Rencontres MASH 04

Mathématiques Appliquées et Sciences de l’Homme

 Mardi 21 septembre 2004 – Salle des Actes Maison de la Recherche UTM

                                                                                                     Résumés des exposés

 

9h10-10h : J.-M.Salanski (Université de Paris X, Nanterre)
Mathématiques, Sciences Humaines, Sciences Cognitives et Philosophie

Résumé :   Mon exposé sera une présentation comparative des trois modes d”interférence des mathématiques avec, respectivement, les sciences humaines, les sciences cognitives et la philosophie. Je voudrais mettre en évidence la variété des postures et des fonctions que la mathématique est amenée à prendre dans ces divers contextes: on peut lui demander des modèles, des paradigmes, une forme méthodique, ou, au contraire, la prendre pour objet afin d’étudier sur  le plan social ou sur le plan cognitif son exercice, ou encore, réfléchir sur la question philosophique de l’idéalité que la mathématique enveloppe, cette brève énumération de possibilités simplement pour donner une idée de la diversité en cause.

10h-10h30 : Pascal Gaillard (Laboratoire Jacques Lordat, UTM)
La catégorisation libre et sa représentation sous forme d’arbre au service de l’évaluation des stratégies auditives.

 Résumé : L'étude des stratégies perceptives en audition implique l'observation du comportement cognitif de sujets. Plusieurs solutions sont disponibles (imagerie cérébrale, neurophysiologie, etc...) donnant des éléments de réponses. La psychoacoustique (et plus exactement la branche de cette discipline qui se base sur le « sens » que l'on donne à l'objet acoustique perçu) utilise entre autres méthodes les tests de catégorisation libre. Ils sont issus d'un cadre théorique développé par Rosch d'abord et Dubois ensuite qui se base sur les principes de catégorisation cognitive et la notion de prototype et de typicalité, soit une évaluation de distances entre des objets cognitifs. Les tests utilisent un protocole relativement simple sur lequel nous ne nous étendrons pas. Ils utilisent enfin une représentation arborée des proximités selon des principes provenant des travaux de Barthélemy, Guénoche et Leclerc.
Cette représentation permet d'aborder les stratégies cognitives employées par les sujets au cours de l'audition d'un son complexe « naturel » et donc portant un sens.
Nous montrerons quelques exemples dans les domaines des sons « musicaux » et des sons de la langue.

10h30-11h : Rui Da Sylva Neves (LTC, UTM)
Comment les individus testent-ils leurs hypothèses : Comparaison avec quelques modèles formels.

10h30-11h : Ludovic Lebart  (ENST Paris)
 
Traitement des réponses aux questions ouvertes et lexicométrie.

12h10-12h40 : Alain Baccini, Sébastien Déjean, Sylvie Viguier-Pla, (LSP UPS)
Statistique Textuelle sur la documentation relative à une mission spatiale de longue durée.

 Résumé : Le travail présenté est le résultat d'études menées dans le cadre d'un projet initié par le Centre National d'Etudes Spatiales et qui s'intitule "Méthode et Outils de Data Mining pour les Projets Spatiaux". La motivation fondamentale de cette action est de contribuer à la réussite d'une mission spatiale de longue durée. Notre objectif dans ce contexte est de proposer des outils d'analyse statistique permettant de suivre l'évolution des connaissances liées au projet à travers l'étude de la documentation. Ce travail implique trois équipes : des linguistes (ERSS, UTM), des informaticiens (IRIT, UPS) et des statisticiens (LSP, UPS). Nous présentons la partie statistique des travaux.

  A partir des données brutes constituées d'un ensemble de documents sur support informatique, la démarche que nous proposons consiste à construire une table de contingence répertoriant les occurrences de mots ou groupes de mots dans chacun des documents. Selon l'outil d'analyse textuelle que nous utilisons pour construire cette table, les documents peuvent être préalablement lemmatisés (réduction des mots en leur forme canonique) ou pas ; la nature technique des documents étudiés semble fournir une certaine robustesse aux méthodes statistiques vis-à-vis de ce problème. Pour exploiter au mieux les informations contenues dans la table, nous mettons en oeuvre des techniques de statistique exploratoire.
 
  Notre exposé présente la mise en oeuvre de cette démarche sur un ensemble de 83 documents issus du projet DORIS/JASON où nous alternons analyses des correspondances et classifications. Les résultats obtenus ont été soumis aux experts du CNES à l'origine des documents étudiés. Nous commentons leurs remarques et concluons en montrant en quoi notre travail contribue à répondre aux préoccupations du CNES.

14h-14h50 : O.Univ.-Prof. Dr. Hans Goebl
L
a classification numérique au service de la géographie linguistique: brève présentation de la dialectométrie et du logiciel VDM (Visual DialectoMetry).
Institut für Romanistik, Universität Salzburg, Akademiestraße 24 ,A - 5020 Salzburg
Tel.:     xx43-662-8044-4451, Fax:             xx43-662-8044-613 oder –4457, e-mail:hans.goebl@sbg.ac.at

Résumé : Les sciences humaines, elles aussi, se servent de méthodes quantitatives en matière de classification et de typologie. Une des applications les plus éloquentes en la matière concerne la géographie linguistique et les atlas linguistiques. Or, un atlas linguistique n'est rien d'autre un ouvrage cartographique en format in-folio qui renseigne, pour un réseau plus ou moins équidistant de N localités (souvent de petite taille), comment l'on y prononce un certain nombre (p) de concepts préalablement choisis. La manière de collecter les données géolinguistiques en question est très simple: il suffit de se rendre sur les lieux, d'y interroger les indigènes d’une façon très simple ("Comment dites-vous (p. ex.) pour l'écureuil?") et de fixer les réponses ainsi obtenues à l’aide d’une transcription phonétique appropriée.

   Or, la structure d'un atlas linguistique est celle d'une matrice bidimensionnelle (N fois p) et permet, de ce fait, tous les calculs respectifs. Malheureusement les géolinguistes – en particulier ceux qui pratiquent les études romanes – ont mis près d'un siècle à découvrir cette possibilité prometteuse. Que ce soit par anti-mathématisme ou simple inadvertance, peu importe.Ce n'est qu'en 1973 qu'a été mis sur pied – ici-même, à Toulouse – de la part du dialectologue occitan Jean Séguy, le terme (et aussi l'idée) d'une "dialectométrie" (DM). Depuis, la DM a pris un essor considérable, surtout à cause de la prise en compte parallèle 1) des apports de la classification numérique, 2) de la cartographie statistique et 3) des multiples possibilités visualisatrices qu'offre l'informatique moderne.

   Le propos central de notre conférence est de présenter les problèmes et méthodes de la DM actuelle à l'aide d'un jeu de méthodes-DM standards et d'exemples applicatifs tirés avant tout de l'"Atlas linguistique de la France" (ALF) qui, lui, constitue le plus grand atlas linguistique du domaine roman (N: 638 points d'enquête; p: 1421 cartes d'atlas). Les méthodes-DM illustrées vont de la visualisation de vecteurs isolés de la matrice de similarité (N fois N) jusqu'au calcul de dendrogrammes (dûment spatialisés après coup) et de cartes de corrélations.

   Au cours de notre conférence nous présenterons des transparents multicolores et aussi, par le biais d'un portable et d’un vidéo-projecteur y branché, un logiciel-DM très puissant (VDM: "Visual DialectoMetry") – créé par mon ami et collaborateur Edgar Haimerl – qui permet non seulement de gérer efficacement les données atlantographiques de base et d'effectuer rapidement les différents calculs-DM, mais aussi de visualiser non moins rapidement et confortablement les résultats numériques des calculs-DM respectifs.

  Un accent particulier sera mis sur les filiations interdisciplinaires de la DM qui vont de la géographie quantitative jusqu'à la génétique des populations. Des exemples respectifs pourront être présentés.

14h50-15h20 : Jean-Pierre Chery (Maison de la télédétection, UMR Cemagref-ENGREF)
Les indicateurs spatiaux.

15h40-16h10 : Régis Gras*, Jean-Claude Régnier**, Pascale Kuntz*, Raphaël Couturier***
HIERARCHIE ORIENTEE DE REGLES GENERALISEES
SUR DES OPINIONS
*LINA– Ecole Polytechnique de l’Université de Nantes, La Chantrerie BP 60601 44306 Nantes cedex   regisgra@club-internet.fr ; pascale.kuntz@polytech.univ-nantes.fr
** EA 3727 Savoirs, Diversité et Professionnalisation, 86, rue Pasteur  69365 Lyon cedex 07   Jean-claude.regnier@univ-lyon2.fr
*** IUT de Belfort  BP 527 – 90016 Belfort cedex    couturie@iut-bm.univ-fcomte.fr

 Résumé :  Partie d’une problématique de la didactique des mathématiques, la méthode statistique implicative se développe au fil des problèmes rencontrés et des questions posées dans d’autres domaines des sciences humaines : psychologie et sociologie entre autres. Son objectif majeur vise la structuration de données croisant individus et variables à travers l'extraction d’une part, de règles entre les variables conduisant à un graphe orienté et, d’autre part, de règles de règles ou règles généralisées conduisant à une hiérarchie orientée. Une règle d’une variable vers une autre est établie sur la base d’une statistique qui confronte les occurrences des contre-exemples à la règle aux occurrences aléatoires attendues d’une indépendance a priori   des variables concernées, eu égard aux occurrences de ces variables et de la population. Une règle généralisée étend ce critère à des classes orientées de variables.

         Ces différentes règles permettent l'explication de liaisons entre des phénomènes, tentent de débusquer une éventuelle causalité et donc autorisent la prévision dans les sciences du vivant ou de l’inerte. Nous montrerons comment la variété des situations réelles envisagées a conduit à dépasser la seule considération de variables binaires. Des données modales, numériques, intervalles sont maintenant traitées. Il est, en outre possible de dégager les éléments graphiques les plus pertinents, ainsi que les catégories des individus les plus responsables des structures. Un logiciel, appelé CHIC, permet tous les calculs et les représentations graphiques. 

         Pour présenter plus particulièrement la notion de hiérarchie orientée et son intérêt, nous nous appuierons sur un exemple tiré d’une enquête d’opinions de professeurs de mathématiques à l’égard de leur propre discipline.

 

                                                   hierarchie_orientee.gif (3346 octets)

              Dans la hiérarchie ci-dessus, nous représentons des règles simples telles que b->c et des règles généralisées telles que (b->c)->(g->f)

Principales références :

Couturier R. “ Traitement de l’analyse statistique implicative dans CHIC ”, Actes des Journées sur la  Fouille dans   les données par la méthode d’analyse implicative, IUFM Caen, 2001, 33-50.

Gras R., Kuntz P., Briand H.,  “ Les fondements de l’analyse statistique implicative et leurs prolongements  pour la fouille de données ”, Mathématiques et Sciences Humaines, 154-155, 2001, 9-29.

Gras R. , Kuntz P., Régnier J.C. “Significativité des niveaux d’une hiérarchie orientée en analyse statistique implicative”, proposé à S.F.C. 04 Bordeaux

16h10-16h40 : Daniel Guy. (Sciences de l’Education, Centre de recherche en Education, Formation et Insertion, université de tlse2)Application des logiques floues à la modélisation de l’opinion,De ses nuances, incertitudes et impressions subjectives.L’opinion des éducateurs sportifs sur le dopage

Résumé :    En formalisant le traitement mathématique des valuations - la valuation étant définie par Kaufmann[1] comme une connaissance subjective d’une personne ou d’un groupe de personnes - les logiques floues, en particulier la théorie des sous-ensembles flous, laissent entrevoir un cadre rigoureux pour étayer le recueil, la description et l’analyse de données subjectives dans un environnement imprécis. D’où l’intérêt de discuter des problèmes, de la portée et des limites de leur application aux Sciences de l’Homme.

Pour introduire ce débat, nous proposons un bref exposé relatif à une application de la théorie des sous-ensembles flous dont le but est de modéliser les points de vue individuels et subjectifs de cent éducateurs sportifs sur les facteurs de risque et de prévention des conduites dopantes.

Arbitrairement, mais de manière raisonnée, trois univers de référence ont été définis conjointement par une équipe de chercheurs et un groupe de dix spécialistes de l’éducation et de la préparation sportives. Le premier référentiel composé de vingt-et-une conduites de préparation à la compétition vise l’objectivation de l’idée que se font les éducateurs du dopage. Le second a pour objet les facteurs de risque, il est défini par douze contextes de fragilisation. Le troisième regroupe treize facteurs de protection. Limités, ces trois référentiels ne sont pas exhaustifs. Néanmoins, ils balaient la diversité des situations qui caractérisent la pratique et l’engagement sportifs. Dans le cas des conduites dopantes, les éducateurs devaient valuer sur une échelle de 0 à 10 - recodée au moment de la saisie des données sur l’intervalle [0,1] - le degré de compatibilité avec l’idée personnelle qu’ils se font du dopage de chacune des vingt-et-une conduites de préparation à la compétition retenues dans le référentiel test. Les opinions individuelles des éducateurs ont pu alors être modélisées, chacune, comme un sous-ensemble flou du référentiel test. Le degré d’appartenance des éléments du référentiel test (les conduites de préparation à la compétition) à un sous-ensemble flou particulier (la modélisation du point de vue d’un éducateur) étant déterminé par les valuations de l’éducateur considéré.

 La détermination entre autres du support, du noyau et du caractère flou de chacun des sous-ensembles ainsi construits permet l’évaluation et la comparaison des points de vue personnels des éducateurs. On pourra alors se demander si les jugements individuels varient en fonction de telle ou telle variable. Par exemple, leur mouvement sportif de référence, scolaire ou fédéral. Le problème le plus délicat restant le passage de la description et de la caractérisation des opinions personnelles à une décision collective des niveaux de risque et de protection fondée sur la pluralité des points de vue individuels. Dans cette recherche a été privilégiée la mise en ordre objective de la multiplicité des points de vue subjectifs opérée par le regroupement des données sous la forme de trois matrices aléatoire floues : une par référentiel test. Mais un tel choix implique la recherche de modalités de présentation des résultats toutes aussi rigoureuses qu’accessibles pour autoriser leur partage et fonder la délibération collective au-delà du cercle étroit des experts.

Cette application particulière, pose la question plus générale de la pertinence de l’application de la théorie des sous-ensembles flous, et au-delà des logiques floues, à la modélisation objective de la doxa, de ses nuances, incertitudes et impressions subjectives.

[1] Nouvelles logiques pour l’intelligence artificielle, Hermes, 1987.  

 

Retour à la page du site.

 

Page maintenue par JF-Culus, le 15 Septembre 2004.