OpenAI признала: o3 и o4-mini чаще «галлюцинируют», чем o1

OpenAI признала: o3 и o4-mini чаще «галлюцинируют», чем o1
08:20, апреля 20, 2025 Ожидавшиеся как более точные и «умные», свежие ИИ-модели OpenAI серии o-серии неожиданно продемонстрировали обратный результат: по собственным тестам компании, уровень их так называемых галлюцинаций оказался значительно выше, чем у предшественников. Согласно техническому отчёту OpenAI, модели o3 и o4-mini, разработанные специально для более продвинутого логического вывода, выдают недостоверные ответы значительно чаще, чем более ранняя модель o1. Результаты были зафиксированы в рамках оценки PersonQA — методики, направленной на проверку уровня галлюцинаций в ответах. Так, o3 продемонстрировала 33% ложных утверждений, а o4-mini — и вовсе 48%, что означает почти каждое второе утверждение с искажённой или вымышленной информацией. Для сравнения: модель o1 показала 16% — почти вдвое меньше. Что особенно примечательно, в системной карте OpenAI прямо указывается, что модель o3 «чаще делает утверждения в целом, что приводит как к росту точных ответов, так и к увеличению числа ложных». Однако в компании признают: причины столь высокого уровня галлюцинаций пока остаются неизвестными, и для их выявления «требуются дополнительные исследования». Серия o-моделей была задумана как альтернатива более вероятностным системам вроде GPT-4.5 и GPT-4o. Они задействуют больше вычислительных ресурсов, чтобы, как указано в описании o1, «дольше обдумывать ответ», использовать разные стратегии мышления и находить ошибки. Предполагалось, что это повысит точность и надёжность, особенно при решени...
Источник: itzine.ru
 
 

Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

OpenAI провела тесты: новые системы ИИ ошибаются чаще прежнего

OpenAI провела тесты: новые системы ИИ ошибаются чаще прежнего Согласно публикации The New York Times, случаи, когда искусственный интеллект выдает неверные данные, называемые галлюцинациями, происходят все чаще. …

Наука и Технологии 00:20, мая 8, 2025 | astera.ru
Максим Кузнецов: Хочется участвовать в Мишкопаде чаще и чаще

Максим Кузнецов: «Хочется участвовать в Мишкопаде чаще и чаще» Нападающий уфимского «Салавата Юлаева» Максим Кузнецов прокомментировал итоги встречи против минского «Динамо» (2:3 ОТ) и поделился впечатлениями от …

Главные новости 08:20, января 2, 2026 | mgazeta.com
Бельгия признала государственность Палестины

Бельгия признала государственность Палестины Бельгия официально присоединилась к странам, которые признали государственность Палестины. Об этом на Генеральной Ассамблеи ООН заявил премьер-минист …

Главные новости 08:20, сентября 23, 2025 | kommersant.ru
Франция признала государственность Палестины

Франция признала государственность Палестины Президент Франции Эмманюэль Макрон заявил, что страна признает Палестину как государство. В своей речи на 80-й Генеральной Ассамблеи ООН, он отметил, …

Главные новости 08:20, сентября 23, 2025 | kommersant.ru
Xiaomi признала девять смартфонов устаревшими

Xiaomi признала девять смартфонов устаревшими Компания Xiaomi внесла в список устаревших устройств еще девять моделей, включая аппараты под брендами Redmi, Poco и Xiaomi. …

Наука и Технологии 16:20, июля 28, 2025 | ilenta.com
ФАС признала Сбербанк нарушившим закон о рекламе

ФАС признала Сбербанк нарушившим закон о рекламе Сбербанк нарушил законодательство о рекламе из-за некорректного сравнения в ней кредитной карты, сообщили в Федеральной антимонопольной службе. Наруш …

Главные новости 16:20, октября 18, 2024 | vz.ru
Лерчек не признала свою вину в суде

Лерчек не признала свою вину в суде Лерчек (настоящее имя — Валерия Чекалина), которую вместе с экс-супругом Артёмом и соучредителем косметического бренда Романом Вишняком задержали на …

Шоу бизнес 08:20, октября 5, 2024 | spletnik.ru
Apple признала iPhone XS винтажным смартфоном

Apple признала iPhone XS винтажным смартфоном Компания Apple внесла iPhone XS в перечень винтажных устройств, поскольку с момента прекращения его продаж прошло пять лет. Напомним, что эта модель …

Гаджеты 00:20, июня 17, 2025 | megaobzor.com