Anthropic: для отравления LLM достаточно 250 вредоносных документов в обучающих данных

Anthropic: для отравления LLM достаточно 250 вредоносных документов в обучающих данных
16:20, октября 13, 2025 Специалисты компании Anthropic, совместно с Институтом безопасности ИИ при правительстве Великобритании, Институтом Алана Тьюринга и другими академическими учреждениями, сообщили, что всего 250 специально подготовленных вредоносных документов достаточно, чтобы заставить ИИ-модель генерировать бессвязный текст при обнаружении определенной триггерной фразы....
Источник: xakep.ru
 
 

Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Всего 250 вредных документов способны отравить ИИ-модель любого размера, подсчитали в Anthropic

Всего 250 вредных документов способны «отравить» ИИ-модель любого размера, подсчитали в Anthropic «Отравить» большую языковую модель оказалось проще, чем считалось ранее, установила ответственная за чат-бот Claude с искусственным интел …

Software 08:20, декабря 17, 2025 | 3dnews.ru
В Брянске разоблачили фейк о брошюрах, обучающих детей общению с бойцами СВО

В Брянске разоблачили фейк о брошюрах, обучающих детей общению с бойцами СВО Жителей Брянской области предупредили о появлении в сети очередного фейка от украинских центров информационно-психологических операций. На этот раз п …

Главные новости 16:20, октября 9, 2024 | bragazeta.ru
Топ  5 интересных обучающих интернет-площадок для специалистов в сфере умного дома

Топ – 5 интересных обучающих интернет-площадок для специалистов в сфере умного дома 04:00, 18 марта 2025, автор: Быстрова А.Топ – 5 интересных обучающих интернет-площадок для специалистов в сфере умного домаКурсы которые помогут разо …

Главные новости 00:20, марта 19, 2025 | incnews.press
СКР уточнил данные о числе жертв отравления в пансионате в Видном // СКР: более 40 человек госпитализировали после отравления в пансионате в Видном

СКР уточнил данные о числе жертв отравления в пансионате в Видном // СКР: более 40 человек госпитализировали после отравления в пансионате в Видном В результате отравления постояльцев частного пансионата для пожилых людей в подмосковном Видном погибли три человека, пострадали более 40. Такие данн …

Происшествия 00:20, декабря 21, 2025 | kommersant.ru
Два вредоносных расширения для Chrome крадут данные

Два вредоносных расширения для Chrome крадут данные Обнаружены два расширения для Chrome, распространяющиеся под общим названием Phantom Shuttle. Они выдают себя за плагины для прокси-сервиса, однако н …

Наука и Технологии 16:20, декабря 25, 2025 | xakep.ru
Grok используется для распространения вредоносных ссылок в X

Grok используется для распространения вредоносных ссылок в X Аналитики Guardio Labs обратили внимание, что злоумышленники используют ИИ-помощника Grok, интегрированного в соцсеть X, для обхода ограничений на ра …

Наука и Технологии 00:20, сентября 5, 2025 | xakep.ru
В Rust-репозитории crates.io выявлены два вредоносных пакета

В Rust-репозитории crates.io выявлены два вредоносных пакета Разработчики языка Rust предупредили о выявлении в репозитории crates.io пакетов faster_log и async_println, содержащих вредоносный код. Пакеты были …

Игры и Интернет 16:20, сентября 27, 2025 | opennet.ru
В AUR-репозитории Arch Linux выявлены ещё 6 вредоносных пакетов

В AUR-репозитории Arch Linux выявлены ещё 6 вредоносных пакетов В репозитории AUR (Arch User Repository), применяемом в Arch Linux для распространения пакетов от сторонних разработчиков, продолжилась публикация вр …

Игры и Интернет 08:20, августа 3, 2025 | opennet.ru