Mise en oeuvre et évaluation de l'éclatement des connexions TCP pour optimiser l'exécution des applications MPI sur une grille

Autor: Alter, Stéphane, Glück, Olivier
Přispěvatelé: Protocols and softwares for very high-performance network (RESO), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), INRIA, École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL)
Jazyk: francouzština
Rok vydání: 2009
Předmět:
Zdroj: [Rapport Technique] RR-6986, INRIA. 2009, pp.25
Popis: Les applications parallèles utilisent généralement le standard MPI pour réaliser leurs communications et s'exécutent aujourd'hui sur des grilles de calcul. Aucune implantation actuelle de MPI ne prend en compte efficacement les contraintes des connexions longue distance permettant l'interconnexion des sites de la grille. MPI5000 est une proposition d'architecture placée entre TCP et MPI permettant l'éclatement des connexions TCP de manière transparente. Celle-ci permet par l'intermédiaire de proxy à l'interface LAN-WAN de différencier les deux types de trafic. Nous avons notamment étudié l'impact de MPI5000 sur une application de MPI_Gather (tous vers un) en regardant le temps d'exécution, le nombre de retransmissions et de timeouts ainsi que l'utilisation CPU. Les expérimentations ont été réalisées sur la grille française Grid'5000.
Databáze: OpenAIRE