Automatic induction$etheoretical aspects, the system ARBRE, medical applications

Autor: Crémilleux, Bruno
Přispěvatelé: codag, Institut d'Informatique et de Mathématiques Appliquées de Grenoble (IMAG), Université Joseph Fourier - Grenoble 1 (UJF)-Institut National Polytechnique de Grenoble (INPG)-Centre National de la Recherche Scientifique (CNRS)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut National Polytechnique de Grenoble (INPG)-Centre National de la Recherche Scientifique (CNRS), Université Joseph-Fourier - Grenoble I, Claudine Robert, Imag, Thèses
Jazyk: francouzština
Rok vydání: 1991
Předmět:
Zdroj: Modélisation et simulation. Université Joseph-Fourier-Grenoble I, 1991. Français
Popis: The aim of this work is to investigatte as a tool for examples bases exploration. Indeed, automatic induction provides a decription of data-file and extracts some knowledge fitted to the problem at hand. It exists a lot of induction algorithms using different pragmatic criterions to choose a variable. A mathematical formalization of the problem of the selection of a variable is proposed. It allows to define a family of "good" criterions based on the choice of a stricly concave function. Elsewhere, uncertain induction systems described in the literature employ pruning methods in the last stage of classification trees building. A pruning method linked to the computation of a quality coefficient and adjusted to our use of uncertain induction is proposed. It makes clear that the construction and the pruning of a tree are dependent on the same theoretical concepts. An induction system (ARBRE) has been developped to make these theoretical consideration concrete and to allow practical proving of their efficiency. By the way, we review the specifications which, in our opinion, are required for a system in uncertain induction. The program ARBRE can perform an immediate exploration of examples bases, without prior knowledge of the domain, and represents the acquired knowledge in the form on induction trees. thrre real medical problems show the interest of using such a system, adapted to any domain where the knowledge is uncertain.
L'objectif de ce travail est d'étudier l'induction en tant qu'outil exploratoire de bases d'exemples. L'induction automatique fournit une description tenant compte de l'ensemble des individus de la base d'exemples et en extrait la connaissance nécessaire à la résolution d'un problème. Il existe de nombreux algorithmes d'induction employant différents critères pragmatiques pour sélectionner une variable. Une formalisation mathématique du problème de la sélection d'une variable est proposée. Elle permet d'une part de définir une famille de "bons" critères reposant sur le choix d'une fonction strictement concave. D'autre part, les systèmes d'induction incertaine décrits dans la littérature emploient des techniques d'élagage dont le but est la construction d'arbres de classement. Une méthode d'élagage liée à un indice de qualité et adaptée à notre usage de l'induction incertaine est proposée. Elle montre en quoi la construction et l'élagage d'un arbre relèvent des mêmes concepts théoriques (l'indice de qualité fait intervenir les résultats des calculs entrepris lors de la construction de l'arbre). Un système d'induction (ARBRE) mettant enoeuvre ces résultats théoriques a été développé. il met en évidence les spécifications qui, à notre avis, sont indispensables pour un système en domaine incertain. Il permet une exploration immédiate de base d'exemples sans connaissance préalable du domaine, et représente la connaissance acquise sous la forme d'arbres d'induction. Trois problèmes médicaux réels montrent l'intérêt de l'usage d'un tel système, adapté à tout domaine où la connaissance est incertaine.
Databáze: OpenAIRE