|
| |
Retour sur la page du site.
Pour avoir une version imprimable.
Rencontres MASH 04
Mathématiques
Appliquées et Sciences de lHomme
Mardi 21 septembre 2004 Salle des Actes
Maison de la Recherche UTM
Résumés des exposés
9h10-10h : J.-M.Salanski
(Université
de Paris X, Nanterre)
Mathématiques, Sciences Humaines, Sciences Cognitives et
Philosophie
Résumé :
Mon exposé sera une présentation comparative des trois modes dinterférence des
mathématiques avec, respectivement, les sciences humaines, les sciences cognitives et la
philosophie. Je voudrais mettre en évidence la variété des postures et des fonctions
que la mathématique est amenée à prendre dans ces divers contextes: on peut lui
demander des modèles, des paradigmes, une forme méthodique, ou, au contraire, la prendre
pour objet afin détudier sur le plan social ou sur le plan cognitif son
exercice, ou encore, réfléchir sur la question philosophique de lidéalité que la
mathématique enveloppe, cette brève énumération de possibilités simplement pour
donner une idée de la diversité en cause. |
10h-10h30 : Pascal Gaillard (Laboratoire
Jacques Lordat, UTM)
La
catégorisation libre et sa représentation sous forme darbre au service de
lévaluation des stratégies auditives. Résumé : L'étude
des stratégies perceptives en audition implique l'observation du comportement cognitif de
sujets. Plusieurs solutions sont disponibles (imagerie cérébrale, neurophysiologie,
etc...) donnant des éléments de réponses. La psychoacoustique (et plus exactement la
branche de cette discipline qui se base sur le « sens » que l'on donne à
l'objet acoustique perçu) utilise entre autres méthodes les tests de catégorisation
libre. Ils sont issus d'un cadre théorique développé par Rosch d'abord et Dubois
ensuite qui se base sur les principes de catégorisation cognitive et la notion de
prototype et de typicalité, soit une évaluation de distances entre des objets cognitifs.
Les tests utilisent un protocole relativement simple sur lequel nous ne nous étendrons
pas. Ils utilisent enfin une représentation arborée des proximités selon des principes
provenant des travaux de Barthélemy, Guénoche et Leclerc.
Cette représentation permet d'aborder les stratégies cognitives employées par les
sujets au cours de l'audition d'un son complexe « naturel » et donc portant un
sens. Nous montrerons quelques exemples dans les domaines
des sons « musicaux » et des sons de la langue. |
10h30-11h :
Rui Da Sylva
Neves (LTC, UTM)
Comment les individus testent-ils leurs hypothèses :
Comparaison avec quelques modèles formels. |
10h30-11h :
Ludovic
Lebart (ENST Paris)
Traitement des réponses aux questions ouvertes et lexicométrie. |
12h10-12h40 : Alain Baccini,
Sébastien Déjean, Sylvie Viguier-Pla, (LSP UPS)
Statistique Textuelle sur la documentation relative à une
mission spatiale de longue durée.
Résumé : Le
travail présenté est le résultat d'études menées dans le cadre d'un projet initié
par le Centre National d'Etudes Spatiales et qui s'intitule "Méthode et Outils de
Data Mining pour les Projets Spatiaux". La motivation fondamentale de cette action
est de contribuer à la réussite d'une mission spatiale de longue durée. Notre objectif
dans ce contexte est de proposer des outils d'analyse statistique permettant de suivre
l'évolution des connaissances liées au projet à travers l'étude de la documentation.
Ce travail implique trois équipes : des linguistes (ERSS, UTM), des informaticiens (IRIT,
UPS) et des statisticiens (LSP, UPS). Nous présentons la partie statistique des travaux.
A partir des données brutes constituées d'un ensemble de documents sur support
informatique, la démarche que nous proposons consiste à construire une table de
contingence répertoriant les occurrences de mots ou groupes de mots dans chacun des
documents. Selon l'outil d'analyse textuelle que nous utilisons pour construire cette
table, les documents peuvent être préalablement lemmatisés (réduction des mots en leur
forme canonique) ou pas ; la nature technique des documents étudiés semble fournir une
certaine robustesse aux méthodes statistiques vis-à-vis de ce problème. Pour exploiter
au mieux les informations contenues dans la table, nous mettons en oeuvre des techniques
de statistique exploratoire.
Notre exposé présente la mise en oeuvre de cette démarche sur un ensemble de 83
documents issus du projet DORIS/JASON où nous alternons analyses des correspondances et
classifications. Les résultats obtenus ont été soumis aux experts du CNES à l'origine
des documents étudiés. Nous commentons leurs remarques et concluons en montrant en quoi
notre travail contribue à répondre aux préoccupations du CNES. |
14h-14h50 :
O.Univ.-Prof. Dr. Hans Goebl
La classification numérique au service de la géographie
linguistique: brève présentation de la dialectométrie et du logiciel VDM (Visual
DialectoMetry).
Institut
für Romanistik, Universität Salzburg, Akademiestraße 24 ,A - 5020 Salzburg
Tel.: xx43-662-8044-4451,
Fax:
xx43-662-8044-613
oder 4457, e-mail:hans.goebl@sbg.ac.at
Résumé : Les
sciences humaines, elles aussi, se servent de méthodes quantitatives en matière de
classification et de typologie. Une des applications les plus éloquentes en la matière
concerne la géographie linguistique et les atlas linguistiques. Or, un atlas linguistique
n'est rien d'autre un ouvrage cartographique en format in-folio qui renseigne, pour un
réseau plus ou moins équidistant de N localités (souvent de petite taille), comment
l'on y prononce un certain nombre (p) de concepts préalablement choisis. La manière de
collecter les données géolinguistiques en question est très simple: il suffit de se
rendre sur les lieux, d'y interroger les indigènes dune façon très simple
("Comment dites-vous (p. ex.) pour l'écureuil?")
et de fixer les réponses ainsi obtenues à laide dune transcription
phonétique appropriée.
Or, la structure d'un atlas linguistique est celle d'une matrice
bidimensionnelle (N fois p) et permet, de ce fait, tous les calculs respectifs.
Malheureusement les géolinguistes en particulier ceux qui pratiquent les études
romanes ont mis près d'un siècle à découvrir cette possibilité prometteuse.
Que ce soit par anti-mathématisme ou simple inadvertance, peu importe.Ce n'est qu'en 1973
qu'a été mis sur pied ici-même, à Toulouse de la part du dialectologue
occitan Jean Séguy, le terme (et aussi
l'idée) d'une "dialectométrie" (DM). Depuis, la DM a pris un essor
considérable, surtout à cause de la prise en compte parallèle 1) des apports de la classification numérique, 2) de la cartographie statistique et 3) des multiples possibilités visualisatrices
qu'offre l'informatique moderne.
Le propos central de notre conférence est de présenter les problèmes et
méthodes de la DM actuelle à l'aide d'un jeu de méthodes-DM standards et d'exemples
applicatifs tirés avant tout de l'"Atlas linguistique de la France" (ALF) qui,
lui, constitue le plus grand atlas linguistique du domaine roman (N: 638 points
d'enquête; p: 1421 cartes d'atlas). Les méthodes-DM illustrées vont de la visualisation
de vecteurs isolés de la matrice de similarité (N fois N) jusqu'au calcul de
dendrogrammes (dûment spatialisés après coup) et de cartes de corrélations.
Au cours de notre conférence nous présenterons des transparents
multicolores et aussi, par le biais d'un portable et dun vidéo-projecteur y
branché, un logiciel-DM très puissant (VDM: "Visual DialectoMetry")
créé par mon ami et collaborateur Edgar Haimerl
qui permet non seulement de gérer efficacement les données atlantographiques de
base et d'effectuer rapidement les différents calculs-DM, mais aussi de visualiser non
moins rapidement et confortablement les résultats numériques des calculs-DM respectifs.
Un accent
particulier sera mis sur les filiations interdisciplinaires de la DM qui vont de la
géographie quantitative jusqu'à la génétique des populations. Des exemples respectifs
pourront être présentés. |
14h50-15h20
: Jean-Pierre Chery (Maison de la
télédétection, UMR Cemagref-ENGREF)
Les indicateurs spatiaux. |
15h40-16h10 : Régis
Gras*, Jean-Claude Régnier**, Pascale Kuntz*, Raphaël Couturier***
HIERARCHIE ORIENTEE DE REGLES GENERALISEES SUR DES
OPINIONS
*LINA
Ecole Polytechnique de lUniversité de Nantes, La Chantrerie BP 60601 44306 Nantes
cedex regisgra@club-internet.fr ;
pascale.kuntz@polytech.univ-nantes.fr
** EA 3727 Savoirs, Diversité et
Professionnalisation, 86, rue Pasteur 69365 Lyon cedex 07
Jean-claude.regnier@univ-lyon2.fr
***
IUT de Belfort BP 527 90016 Belfort
cedex couturie@iut-bm.univ-fcomte.fr
Résumé : Partie dune
problématique de la didactique des mathématiques, la méthode statistique implicative se
développe au fil des problèmes rencontrés et des questions posées dans dautres
domaines des sciences humaines : psychologie et sociologie entre autres. Son objectif
majeur vise la structuration de données croisant individus et variables à travers
l'extraction dune part, de règles entre les variables conduisant à un graphe
orienté et, dautre part, de règles de règles ou règles généralisées
conduisant à une hiérarchie orientée. Une règle dune variable vers une autre est
établie sur la base dune statistique qui confronte les occurrences des
contre-exemples à la règle aux occurrences aléatoires attendues dune
indépendance a priori des variables
concernées, eu égard aux occurrences de ces variables et de la population. Une règle
généralisée étend ce critère à des classes orientées de variables.
Ces différentes règles permettent l'explication de liaisons entre des
phénomènes, tentent de débusquer une éventuelle causalité et donc autorisent la
prévision dans les sciences du vivant ou de linerte. Nous montrerons comment la
variété des situations réelles envisagées a conduit à dépasser la seule
considération de variables binaires. Des données modales, numériques, intervalles sont
maintenant traitées. Il est, en outre possible de dégager les éléments graphiques les
plus pertinents, ainsi que les catégories des individus les plus responsables des
structures. Un logiciel, appelé CHIC, permet tous les calculs et les représentations
graphiques.
Pour présenter plus particulièrement la notion de hiérarchie orientée et son
intérêt, nous nous appuierons sur un exemple tiré dune enquête
dopinions de professeurs de mathématiques à légard de leur propre
discipline.

Dans la hiérarchie ci-dessus, nous représentons des
règles simples telles que b->c et des règles généralisées telles que
(b->c)->(g->f)
Principales
références :
Couturier R. Traitement de
lanalyse statistique implicative dans CHIC , Actes des Journées sur
la Fouille dans les données par
la méthode danalyse implicative, IUFM Caen, 2001, 33-50.
Gras
R., Kuntz P., Briand H., Les
fondements de lanalyse statistique implicative et leurs prolongements pour la fouille de données , Mathématiques
et Sciences Humaines, 154-155, 2001, 9-29.
Gras
R. , Kuntz P., Régnier J.C. Significativité des niveaux
dune hiérarchie orientée en analyse statistique implicative, proposé à
S.F.C. 04 Bordeaux |
16h10-16h40 : Daniel
Guy. (Sciences de
lEducation, Centre de recherche en Education, Formation et Insertion, université de
tlse2)Application des logiques floues à la modélisation
de lopinion,De ses nuances, incertitudes et impressions subjectives.Lopinion
des éducateurs sportifs sur le dopage
Résumé :
En formalisant le traitement mathématique des valuations - la
valuation étant définie par Kaufmann[1] comme
une connaissance subjective dune personne ou dun groupe de personnes -
les logiques floues, en particulier la théorie des sous-ensembles flous, laissent
entrevoir un cadre rigoureux pour étayer le recueil, la description et lanalyse de
données subjectives dans un environnement imprécis. Doù lintérêt de
discuter des problèmes, de la portée et des limites de leur application aux Sciences de
lHomme.
Pour introduire ce débat, nous proposons un bref
exposé relatif à une application de la théorie des sous-ensembles flous dont le but est
de modéliser les points de vue individuels et subjectifs de cent éducateurs sportifs sur
les facteurs de risque et de prévention des conduites dopantes.
Arbitrairement, mais de manière raisonnée, trois
univers de référence ont été définis conjointement par une équipe de chercheurs et
un groupe de dix spécialistes de léducation et de la préparation sportives. Le
premier référentiel composé de vingt-et-une conduites de préparation à la
compétition vise lobjectivation de lidée que se font les éducateurs du
dopage. Le second a pour objet les facteurs de risque, il est défini par douze contextes
de fragilisation. Le troisième regroupe treize facteurs de protection. Limités, ces
trois référentiels ne sont pas exhaustifs. Néanmoins, ils balaient la diversité des
situations qui caractérisent la pratique et lengagement sportifs. Dans le cas des
conduites dopantes, les éducateurs devaient valuer sur une échelle de 0 à 10 -
recodée au moment de la saisie des données sur lintervalle [0,1] - le degré de compatibilité avec lidée
personnelle quils se font du dopage de chacune des vingt-et-une conduites de
préparation à la compétition retenues dans le référentiel test. Les opinions
individuelles des éducateurs ont pu alors être modélisées, chacune, comme un
sous-ensemble flou du référentiel test. Le degré dappartenance des éléments du
référentiel test (les conduites de préparation à la compétition) à un sous-ensemble
flou particulier (la modélisation du point de vue dun éducateur) étant
déterminé par les valuations de léducateur considéré.
La
détermination entre autres du support, du noyau et du caractère flou de chacun des
sous-ensembles ainsi construits permet lévaluation et la comparaison des points de
vue personnels des éducateurs. On pourra alors se demander si les jugements individuels
varient en fonction de telle ou telle variable. Par exemple, leur mouvement sportif de
référence, scolaire ou fédéral. Le problème le plus délicat restant le passage de la
description et de la caractérisation des opinions personnelles à une décision
collective des niveaux de risque et de protection fondée sur la pluralité des points de
vue individuels. Dans cette recherche a été privilégiée la mise en ordre objective de
la multiplicité des points de vue subjectifs opérée par le regroupement des données
sous la forme de trois matrices aléatoire floues : une par référentiel test. Mais
un tel choix implique la recherche de modalités de présentation des résultats toutes
aussi rigoureuses quaccessibles pour autoriser leur partage et fonder la
délibération collective au-delà du cercle étroit des experts.
Cette application particulière, pose la question plus
générale de la pertinence de lapplication de la théorie des sous-ensembles flous,
et au-delà des logiques floues, à la modélisation objective de la doxa, de ses
nuances, incertitudes et impressions subjectives.
[1] Nouvelles
logiques pour lintelligence artificielle, Hermes, 1987. |
Retour à la page du site.
Page maintenue par JF-Culus, le
15 Septembre 2004.
|