Popis: |
RESUME. Le travail que nous présentons ici a pour but la comparaison de méthodes de sélection d’attributs. Plus précisément, nous nous intéressons à deux grandes approches, celles fondées uniquement sur les données, approche classique qui permet de ne se reposer, pour la construction de modèles de catégorisation, que sur un ensemble restreint, mais pertinent, d’attributs, et celles qui découlent d’un modèle appris. Ces dernières permettent d’expliquer les décisions prises par un modèle, et fournissent aux utilisateurs des moyens de voir ce qui se passe à l’intérieur de la “boîte noire” qu’est bien souvent un catégoriseur. De plus, la comparaison de ces deux approches permet d’évaluer dans quelle mesure les premières sont suffisamment sélectives comparées aux deuxièmes. Notre comparaison expérimentale est réalisée pour une large part sur une collection de résumés médicaux constituée par l’Institut Suisse de Bioinformatique. |