Le programme de TALN et RECITAL comporte, en plus des
communications orales ou affichées, des conférences
invitées, des tutoriels et des ateliers.
Tutoriels
"Approches quantitatives des corpus
de textes"
"Meta-données et
ressources linguistiques"
Tutoriels
Les tutoriels auront lieu le lundi après-midi.
Tutoriel
1 : "Approches quantitatives des corpus de textes"
par André Salem, Prof - Université de la Sorbonne
nouvelle - Paris 3 et Ludovic Lebart - DR- CNRS/ENST
a) Historique
b) Domaines et problèmes de la textométrie
c) Les unités de la statistique textuelle
d) Méthodes de statistique textuelle
Spécificités, analyses factorielles,
classification
e) Applications à des corpus de textes politiques
f) Applications au dépouillement d'enquête
g) Quelques problématiques nouvelles
La topographie textuelle, la résonance
textuelle
h) Quelques logiciels d'analyse textométrique
Travaux pratiques sur un logiciel de
textométrie (Lexico3)
Retour en haut de page
Tutoriel 2 : "Meta-données et ressources
linguistiques"
par Laurent
Romary, DR INRIA (LORIA, Nancy)
Le tutoriel comprendra 4 points:
1) Cycle de vie et ressources linguistiques
a) création
b) gestion et diffusion
2) Meta-données et bases techniques
a) Etat de l'art de ce qui a été fait dans
le domaine bibliographique et efforts internationaux (Dublin Core, ISO
11179, RDF, RDF Awl, TEI)
b) Protocole d'acquisition de meta-données pour
indexation ou le moissonnage
3) Identification et gestion de ressources linguistiques (pratique)
TEI & corpus, OAI & OLAC, MDI
4) Modélisation de ressources linguistiques et
meta-données
Répertoires de catégories de données
pour les ressources linguistiques
Application au lexique
Retour en
haut de page