news.shamcode.ru | Исследователи показали, что ИИ можно джейлбрекнуть с помощью повторения промптов

Исследователи показали, что ИИ можно джейлбрекнуть с помощью повторения промптов

четверг, 26 декабря 2024 г. в 00:00:22

https://xakep.ru/2024/12/25/best-of-n/
Специалисты компании Anthropic, разрабатывающей семейство больших языковых моделей (LLM) Claude, опубликовали исследование, которое демонстрирует, что LLM можно принудить выполнять запрещенные действия, повторяя промпты на разный лад, а также автоматизировав этот процесс.