Academia.eduAcademia.edu

Classification Automatique

description44 papers
group1 follower
lightbulbAbout this topic
Classification Automatique is a subfield of machine learning and artificial intelligence focused on the development of algorithms and models that automatically categorize data into predefined classes or labels based on its features, enabling efficient data organization, retrieval, and analysis.
lightbulbAbout this topic
Classification Automatique is a subfield of machine learning and artificial intelligence focused on the development of algorithms and models that automatically categorize data into predefined classes or labels based on its features, enabling efficient data organization, retrieval, and analysis.
The development of dynamic information analysis methods, like incremental clustering, concept drift management and novelty detection techniques, is becoming a central concern in a bunch of applications whose main goal is to deal with... more
Résumé—Dans ce papier nous étudions deux approches de localisation de défauts, basée sur l'analyse en composantes principales (ACP). Un indice de détection calculéa partir des dernieres composantes principales est utilisé pour la... more
Le cancer du sein est un problème de santé publique. L'imagerie médicale est l'un des éléments clés dans le diagnostic. Cependant, la qualité d'interprétation d'une mammographie reste variable. Une des caractéristiques de l'anatomie et de... more
Une memoire organisationnelle est un espace de capitalisation d’informations diverses circulant au sein d’une entreprise. L’objectif de nos travaux est d’assister les usagers dans le classement de ces informations au sein de cette memoire... more
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or... more
Cet article présente l’édition 2018 de la campagne d’évaluation DEFT (Défi Fouille de Textes). A partir d’un corpus de tweets, quatre tâches ont été proposées : identifier les tweets sur la thématique des transports, puis parmi ces... more
La classification (supervisee, non supervisee et semi-supervisee) est une thematique importante de la fouille de donnees. Dans cette these, nous nous concentrons sur le developpement d'approches d'optimisation pour resoudre... more
Cet article est une traduction de l'article Comparing Student Models in Different Formalisms by Predicting their Impact on Help Success publié dans les actes de la 16th International Conference on Artificial Intelligence in Education.... more
Une série de programmes informatiques pour l'étude des circulations synoptiques à partir des cartes d'altitude du Bulletin Météorologique Européen (BME), a été mise au point par le Laboratoire de Climatologie de l'Université de Liège. Ces... more
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or... more
L'objectif de cet article est de montrer les intérêts et les inconvénients de deux approches classificatoires de courbes. La première est basée sur une représentation des courbes sous forme vectorielle, la seconde propose la distance de... more
Une memoire organisationnelle est un espace de capitalisation d’informations diverses circulant au sein d’une entreprise. L’objectif de nos travaux est d’assister les usagers dans le classement de ces informations au sein de cette memoire... more
The development of dynamic information analysis methods, like incremental clustering, concept drift management and novelty detection techniques, is becoming a central concern in a bunch of applications whose main goal is to deal with... more
La classification (supervisee, non supervisee et semi-supervisee) est une thematique importante de la fouille de donnees. Dans cette these, nous nous concentrons sur le developpement d'approches d'optimisation pour resoudre... more
Cet article présente l'édition 2018 de la campagne d'évaluation DEFT (Défi Fouille de Textes). A partir d'un corpus de tweets, quatre tâches ont été proposées : identifier les tweets sur la thématique des transports, puis parmi ces... more
In this work, we propose a new efficient agglomerative algorithm for hierarchical clustering analysis (HCA) of large networks. This algorithm, called Mod-Müllner, is an adaptation of an existing algorithm proposed by Müllner in 2011 and... more
This paper studies the problem of feature selection in the context of Semi-Supervised Support Vector Machine (S3VM). The zero norm, a natural concept dealing with sparsity, is used for feature selection purpose. Due to two nonconvex terms... more
This paper presents an original approach based on a recent metric called feature maximization for developing accurate diachronic analysis tools. In such process, querying of bibliographic databases is firstly exploited to provide a... more
Traditional quality indexes (Inertia, DB,. . .) are known to be method-dependent indexes that do not allow to properly estimate the quality of the clustering in several cases, as in that one of complex data, like textual data. We thus... more
In this paper we first propose a state of the art on the methods for the visualization and the interpretation of textual data, in particular of scientific data. We then shortly present our contributions to this field in the form of... more
We introduce Diachronic'Explorer, a toolbox to produce and visualize diachronic results, which is based on a new complete theoretic framework for diachrony that we detail. This toolbox, which is dedicated to run diachronic algorithms from... more
Cette presentation propose une description des caracteristiques intra-linguistiques des discussions Wikipedia, forum de discussion associe a chaque article de l'encyclopedie Wikipedia. Apres un expose des proprietes qui font de ces... more
As regard to the evolution of the concept of text and to the continuous growth of textual information of multiple nature which is available online, one of the important issues for linguists and information analysts for building up... more
This paper deals with a new feature selection and feature contrasting approach for classification of highly unbalanced textual data with a high degree of similarity between associated classes. The efficiency of the approach is illustrated... more
This paper presents the application of a new method of feature selection for the analysis of the evolution and interaction of scientific domains. The query of bibliographic databases provides a corpus of scientific publications in... more
This paper focuses on a subtask of the QUAERO 1 research program, a major innovating research project related to the automatic processing of multimedia and multilingual content. The objective discussed in this article is to propose a new... more
Traditional quality indexes (Inertia, DB,. . .) are known to be method-dependent indexes that do not allow to properly estimate the quality of the clustering in several cases, as in that one of complex data, like textual data. We thus... more
The disambiguation of named entities is a challenge in many fields such as scientometrics, social networks, record linkage, citation analysis, semantic web...etc. The names ambiguities can arise from misspelling, typographical or OCR... more
Ce travail s'inscrit dans le cadre du programme de recherche QUAERO 1 , un vaste projet de recherche et d'innovation se rapportant au traitement automatique de contenus multimédias et multilingues. L'objectif abordé dans cet article est... more
Feature maximization is a cluster quality metric which favors clusters with maximum feature representation as regard to their associated data. This metric has already been successfully exploited, altogether, for defining unbiased... more
Cet article traite de la construction automatique et dynamique de dossiers consolidés. La construction de dossiers utilise plusieurs étapes : recherche des documents les plus significatifs à partir d'une requête par mots-clés,... more
This paper presents an original approach based on a recent metric called feature maximization for developing accurate diachronic analysis tools. In such process, querying of bibliographic databases is firstly exploited to provide a... more
L'objectif de cet article est de montrer les intérêts et les inconvénients de deux approches classificatoires de courbes. La première est basée sur une représentation des courbes sous forme vectorielle, la seconde propose la distance de... more
Le foisonnement des methodes a noyaux reside dans l’astuce du noyau, induisant implicitement une transformation non-lineaire a cout calculatoire reduit. Cependant, la transformation inverse est souvent cruciale. La resolution de ce... more
Nous nous plaçons dans le cadre de la classification automatique. Nous abordons le problème de l'estimation du nombre de classes et des paramètres qui leurs sont associés. Nous proposons une méthode utilisant l'hypothèse contextuelle... more
La Veille Technologique est au gout du jour. Et pour cause, le besoin en France se fait sentir. Les entreprises prennent conscience de l'indispensable necessite de gerer l'information qui les environne. C'est a ce titre... more
La bibliométrie, ensemble de méthodes statistiques d'évaluation de l'information scientifique et technique, entre de façon déterminante dans les systèmes d'aide à la décision tels que la veille technologique. Elle permet une gestion... more
Background: Epileptic seizures anticipatory anxiety has not been assessed so far while it is a frequent complaint in patients with active epilepsy that may strongly impact their quality of life Our aim was to assess the prevalence and the... more
Download research papers for free!