Výsledky vyhledávání - "Flores, Juan Arturo Nolazco"

Report

Jailbreaking Large Language Models with Symbolic Mathematics

Autor: Bethany, Emet, Bethany, Mazal, Flores, Juan Arturo Nolazco, Jha, Sumit Kumar, Najafirad, Peyman

Recent advancements in AI safety have led to increased efforts in training and red-teaming large language models (LLMs) to mitigate unsafe content generation. However, these safety mechanisms may not be comprehensive, leaving potential vulnerabilitie

Externí odkaz: http://arxiv.org/abs/2409.11445

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání