Academia.eduAcademia.edu

Outline

D'Extraction Automatique Du Langage

2006

Abstract

New text analysis softwares issued from fields of research such as Machine Learning and Natural Languages Processing prove to be relevant tools for the language sciences. Littératron is a new data-processing tool for the automatic extraction of syntactic patterns, designed at LIP6 by Jean-Gabriel Ganascia. Associated with a linear text analyser, it reveals the stylistic peculiarities of a text. We will see that Littératron carries out a linguistic diagnosis of learners if used in language sciences, especially in the field of acquisition of written French as a foreign language. The learner can be from a heterogeneous group (various language levels and various mother tongues) or from a homogeneous group (only one language level and one mother tongue, here, Arabic). The interest of this approach is related to three fields: first, language didactics, on a purely educational basis; next, computational linguistics; finally, computer-assisted learning. De nouveaux logiciels d"analyse textuelle tirent partie des progrès récents effectués en apprentissage symbolique et dans le traitement automatique des langues naturelles. Conçu au LIP6 par Jean-Gabriel Ganascia, le Littératron est l'un d'entre eux ; il extrait automatiquement des motifs syntaxiques i à partir de textes écrits en langage naturel. Plus exactement, le Littératron prend comme entré un arbre d'analyse syntaxique et donne en sortie un certain nombre de motifs syntaxiques récurrents. Associé à un analyseur de textes, qui engendre l'arbre d'analyse syntaxique à partir de textes écrits en langage naturel, il révèle les singularités stylistiques de ces textes. Nous allons voir qu"utilisé en sciences du langage, dans le domaine de l"acquisition du français écrit, le Littératron permet d'effectuer un diagnostic linguistique de l"apprenant, que celui-ci provienne d"une classe de langue hétérogène (différentes langues maternelles) ou homogène (une seule langue maternelle, en l"occurrence ici l"arabe). L"intérêt de cette approche concerne trois domaines : d"une part la didactique des langues, à titre éducatif ; d"autre part, la linguistique computationnelle, et enfin l"enseignement assisté par ordinateur.

References (16)

  1. Adam, J.-M. (1992). Les textes : types et prototypes. Récit, description, argumentation, explication et dialogue. Paris : Nathan.
  2. Besse, J.-M. (dir.) (2003). Qui est illettré ? Décrire et évaluer les difficultés à se servir de l"Ecrit. Paris : Retz.
  3. Carroll, M. & Stutterheim Ch. (1997). "Relations entre grammaticalisation et conceptualisation et implications sur l"acquisition d"une langue étrangère". Acquisition et Interaction en Langue Etrangère (AILE), vol. 9, pp. 14-19.
  4. Dupoux, E. (ed.) (2001). Language, brain and cognitive development : Essays in Honor of Jacques Mehler, Cambridge, Mass. : MIT Pr. Morais J. & Kolinsky R. (2001). "The literate mind and the universal human mind". In Dupoux. pp. 463-480.
  5. Ganascia, J.-G. (2001). "Extraction automatique de motifs syntaxiques". In actes du colloque Traitement Automatique du Langage Naturel 2001 (TALN 2001). Consulté en juillet 2005. http://www.li.univ-tours.fr/taln-recital-2001/index1.html JADT 2006 : 8 es Journées internationales d"Analyse statistique des Données Textuelles
  6. Ganascia, J.-G. (2001). "Extraction of Recurrent Patterns from Stratified Ordered Trees". In actes de Machine Learning : 12 th European Conference of Machine Learning 2001 (ECML 2001). Freiburg : Springer-Verlag, pp. 167-179.
  7. Ganascia, J.-G. (2004). "Detection of Statistically Abnormal Patterns from Stratified Ordered Trees". In Milutinovic & Vujovic Milutinovic, (dir.) Advances in the Internet Technology, Concepts and Systems. .
  8. Garcia-Debanc, C. (1993). "Enseignement de la langue et production d'écrits". In Ecriture et langue, Garcia-Debanc (dir.). Pratiques, 77. pp 3-23.
  9. Giguet, E. (1998). "Méthode pour l"analyse automatique de structures formelles sur documents multilingues". Thèse de doctorat en informatique, Université de Caen. Consulté en juillet 2005. http://users.info.unicaen.fr/~giguet/these/
  10. Kahn, G. (dir.) (1993). Des pratiques de l'écrit. numéro spécial Le Français dans le Monde. Paris : Hachette.
  11. Mangenot, F. (1998). "Outils textuels pour l'apprentissage de l'écriture en L1 et en L2". In Pratiques discursives et acquisition des langues étrangères, Souchon, M. (dir.). Actes du X e colloque international "Acquisition d'une langue étrangère : perspectives et recherches". Besançon : Université de Franche-Comté. pp 515-525.
  12. Moirand, S. (1990). Une grammaire des textes et des dialogues. Paris : Hachette FLE. Pery-Woodley, M.-P. (1993). Les écrits dans l'apprentissage. Clés pour analyser les productions des apprenants. Paris: Hachette FLE.
  13. Scardamalia, M. & Bereiter, C. (1986). "Research on written composition". In Handbook of research on teaching, Wittrock, M.C. (dir.). New York : McMillan. pp 778-803.
  14. Tagliante, C. (1994). La classe de langue. Paris : CLE International.
  15. Tuffs, R., (1993), "A genre approach to writing in the second language classroom : the use of direct mail letters". Revue belge de philology et d'histoire, vol. 71, n°3, pp. 691-721.
  16. Vergne, J. (1999). "Etude et modélisation de la syntaxe des langues à l"aide de l"ordinateur. Analyse syntaxique non combinatoire Synthèse et résultats". Habilitation à Diriger des Recherches, Université de Caen. Consulté en juillet 2005. http://users.info.unicaen.fr/~jvergne/#HDR.