Comparaison entre l'analyse canonique généralisée régularisée et l'algorithme PLS pour l'analyse des tableaux multiples
Autor: | Tenenhaus, Arthur, Tenenhaus, Michel |
---|---|
Přispěvatelé: | Supélec Sciences des Systèmes (E3S), Ecole Supérieure d'Electricité - SUPELEC (FRANCE), El Rassi, Karine |
Jazyk: | francouzština |
Rok vydání: | 2011 |
Předmět: | |
Zdroj: | Actes des 43e journées de Statistique (JDS'11) 43è journées de Statistique (JDS'11) 43è journées de Statistique (JDS'11), May 2011, Gammarth, Tunisie. pp.221-226 |
Popis: | L'analyse canonique généralisée régularisée (RGCCA pour Regularized Generalized Canonical Correlation Analysis) a été récemment proposée par Tenenhaus et Tenenhaus (2011) pour l'analyse des tableaux multiples. RGCCA unifie des méthodes d'analyse de tableaux multiples basées sur la maximisation d'un critère de corrélation et/ou de covariance entre les composantes résumant chaque tableau. Citons des cas particuliers de RGCCA : analyse canonique régularisée, analyse canonique généralisée (SUMCOR de Horst, SSQCOR de Kettenring, SABSCOR de Mathes et Hanafi), régression PLS généralisée (MAXDIFF de Van de Geer, MAXDIFF B de Hanafi et Kiers, SABSCOV de Krämer), régression PLS hiérarchique, analyse canonique hiérarchique, analyse des redondances hiérarchique, analyse de concordance de Hanafi et Lafosse, analyse de co-inertie multiple de Chessel et Hanafi, analyse de co-inertie multiple orthogonale généralisée de Vivien et Sabatier, approche PLS de Wold (PLS-PM pour PLS path modeling) avec l'option mode B. PLSPM est souvent utilisé avec l'option mode A (Wold (1985), Tenenhaus et al. (2005)). Cet algorithme fonctionne très bien dans la pratique, mais il n'existe pas de preuve de sa convergence. L'algorithme RGCCA " nouveau mode A " est proche de l'algorithme PLS-PM mode A, mais a l'avantage de reposer sur un problème d'optimisation dont la résolution est basée sur un algorithme itératif à convergence monotone. La seule différence entre les deux algorithmes réside dans la normalisation de la composante externe : composante externe standardisée pour PLS-PM et vecteur de poids externe normalisé pour RGCCA " nouveau mode A ". On peut donc penser que RGCCA " nouveau mode A " donnera plus d'importance aux tableaux de grande dimension qu'aux tableaux caractérisés par peu de variables. L'objectif de cette communication est de comparer les résultats de RGCCA avec l'option " nouveau mode A " à ceux de PLS-PM mode A. Les premières comparaisons montrent qu'en fait les comportements des deux algorithmes sont très similaires. |
Databáze: | OpenAIRE |
Externí odkaz: |