Výsledky vyhledávání - "Xiang, Jiuyang"

Report

Speak Out of Turn: Safety Vulnerability of Large Language Models in Multi-turn Dialogue

Autor: Zhou, Zhenhong, Xiang, Jiuyang, Chen, Haopeng, Liu, Quan, Li, Zherui, Su, Sen

Large Language Models (LLMs) have been demonstrated to generate illegal or unethical responses, particularly when subjected to "jailbreak." Research on jailbreak has highlighted the safety issues of LLMs. However, prior studies have predominantly foc

Externí odkaz: http://arxiv.org/abs/2402.17262

Zobrazit plný text záznamu

Report

Quantifying and Analyzing Entity-level Memorization in Large Language Models

Autor: Zhou, Zhenhong, Xiang, Jiuyang, Chen, Chaomeng, Su, Sen

Large language models (LLMs) have been proven capable of memorizing their training data, which can be extracted through specifically designed prompts. As the scale of datasets continues to grow, privacy risks arising from memorization have attracted

Externí odkaz: http://arxiv.org/abs/2308.15727

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání