Zobrazeno 1 - 5
of 5
pro vyhledávání: '"He, Longzhu"'
Alignment-Enhanced Decoding:Defending via Token-Level Adaptive Refining of Probability Distributions
Large language models are susceptible to jailbreak attacks, which can result in the generation of harmful content. While prior defenses mitigate these risks by perturbing or inspecting inputs, they ignore competing objectives, the underlying cause of
Externí odkaz:
http://arxiv.org/abs/2408.07663
Publikováno v:
In Expert Systems With Applications 1 January 2025 259
Publikováno v:
In Future Generation Computer Systems November 2024 160:890-900
Publikováno v:
In Phytomedicine 15 January 2014 21(2):177-183
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.