Protocoles Efficaces et Robustes pour l’Apprentissage Automatique Semi-Décentralisé Préservant la Confidentialité

Autor: Sabater, C. (César)
Přispěvatelé: Jan Ramon, Machine Learning in Information Networks [MAGNET], Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Popis: Ces dernières années, la préoccupation pour la protection de la vie privée s'est considérablement accrue. Cela s'explique par l'utilisation régulière de services qui nécessitent l'externalisation et le traitement massif de données personnelles, souvent sensibles. Pour cette raison, les mesures visant à réglementer la manipulation des données personnelles et à empêcher leur divulgation ont gagné en importance.Deux limitations importantes des algorithmes existants utilisés dans le domaine de l'apprentissage automatique sont qu'ils ne sont souvent pas robustes contre les attaques par collusion, et qu'un tiers de confiance est nécessaire pour (entre autres) effectuer une perturbation aléatoire permettant d'obtenir des garanties de confidentialité différentielle (differential privacy). Cette thèse vise à résoudre ces problèmes. Elle contient en particulier deux contributions majeures.La première contribution est un protocole décentralisé et sécurisé qui effectue une agrégation satisfaisant la confidentialité différentielle. Dans ce contexte, chaque partie possède ses propres données privées et souhaite calculer de manière collaborative une statistique, par exemple une moyenne, sans divulguer ses informations sensibles. Notre protocole est robuste aux attaques d'inférence par des parties en collusion et permet de vérifier l'exactitude des calculs. Il nécessite que chaque partie ne communique qu'avec un nombre logarithmique d'autres parties et permet d'obtenir des garanties de confidentialité différentielle avec une utilité presque équivalente au cas où l'on aurait recourt à un tiers de confiance.La deuxième contribution propose un protocole pour générer des nombres aléatoires dans un cadre de calcul multipartite de telle sorte que toutes les parties puissent vérifier que le nombre généré suit ladistribution de probabilité souhaitée et est effectivement pseudo-aléatoire, c'est-à-dire qu'aucun groupe de parties en collusion ne peut en fausser le caractère aléatoire. En particulier, nous considérons le tirage de nombres aléatoires publics (de sorte que toutes les parties puissent les voir), privés (de sorte qu'une seule partie puisse les voir) ou de manière cachée (de sorte qu'ils soient émis sous forme de parts secrètes et ne soient donc connus d'aucune des parties). Nous instancions nos méthodes de tirage de nombres aléatoires pour la distribution de Laplace et la distribution gaussienne. Comme sous-produit de notre approche pouvant avoir un intérêt en soi, nous proposons des algorithmes à divulgation nulle de connaissance pour vérifier les calculs transcendantaux tels que les fonctions logarithmique, trigonométrique et exponentielle. In recent years, the concern for privacy has significantly grown. This is a consequence of the regular use of data-intensive services that require the massive outsourcing and processing of individuals data, which is often sensitive. For that reason, measures to regulate the manipulation of individual's data and to prevent its exposure gained notable relevance.Two important limitations of existing algorithms as used in the field of machine learning are that they often aren't robust against colluding adversaries, and that a trusted party is needed to among others perform differential privacy perturbation. This PhD dissertation aims to address these problems. In particular it contains two major contributions.The first contribution of this work is a decentralized and secure protocol that performs differentially private aggregation. In this setting, each party in a group has its own private data, and they want to collaboratively compute a statistic, e.g., an average, without disclosing the sensitive information. Our protocol is robust against inference attacks by colluding parties and allows for verification of the correctness of computations. It only requires every party to communicate with a logarithmic number of other parties, and achieves differential privacy with an utility nearly as good as in the trusted central curator setting.The second contribution proposes a protocol to draw random numbers in a multi-party computing setting in such a way that all parties can verify that the generated number follows a prescribed probability distribution and is effectively pseudo-random, i.e., no group of colluding parties can bias the randomness. In particular, we consider drawing random numbers publicly (so all parties can see them), privately (so exactly one party can see them) or in a hidden way (so they are output as secret shares and hence aren't known by any of the parties). We instantiate our methods for drawing random numbers from the Laplace and Gaussian distributions. As a byproduct of independent interest, we propose algorithms to verify transcendental computations such as logarithmic, trigonometric and exponential functions in zero knowledge.
Databáze: OpenAIRE