Новые нейросети OpenAI «бредят» больше предшественников

Новые нейросети OpenAI «бредят» больше предшественников
16:20, апреля 23, 2025 Недавно выпущенные модели искусственного интеллекта OpenAI o3 и o4-mini, хотя во многих отношениях являются передовыми, галлюцинируют и выдумывают чаще, чем некоторые из предыдущих моделей. Внутреннее тестирование OpenAI показало, что o3 галлюцинирует в ответ на 33% вопросов из PersonQA — бенчмарка компании для измерения точности знаний модели о людях. Этот показатель примерно вдвое превышает уровень галлюцинаций предыдущих моделей рассуждений o1 и o3-mini, которые составили 16% и 14,8% соответственно. С o4-mini ситуация ещё хуже — 48%.Ранее каждая новая модель снижала уровень галлюцинаций, но o3 и o4-mini нарушают эту закономерность. Независимое тестирование Transluce также выявило доказательства того, что o3 фальсифицирует свои действия: в одном примере исследователи наблюдали, как модель o3 утверждала, что «запустил код на MacBook Pro 2021 года вне ChatGPT», а затем скопировала результаты в ответ. Хотя o3 имеет доступ к некоторым инструментам, она не может этого сделать.Ещё больше беспокойство вызывает тот факт, что OpenAI не понимает причин этого явления. В техническом отчёте по o3 и o4-mini компания отмечает: «Необходимы дополнительные исследования, чтобы понять, почему уровень галлюцинаций увеличивается при масштабировании моделей рассуждений». Модели o3 и o4-mini по-прежнему превосходят предшественников в некоторых областях, в том числе в задачах, связанных с программированием и математикой. По сообщению OpenAI, поскольку они «генерируют больше утверждений в целом», он...
Источник: mobidevices.com
 
 

Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Apple заманивает в нейросети // Будут ли новые функции iOS 18 доступны и безопасны для пользователей

Apple заманивает в нейросети // Будут ли новые функции iOS 18 доступны и безопасны для пользователей Apple представила операционную систему iOS 18. Корпорация внедрит в устройства искусственный интеллект. Пользователям будет доступна как собственная …

Наука и Технологии 20:00, июня 12, 2024 | kommersant.ru
Избирателей заманивают в нейросети // Новые люди вписали искусственный интеллект в свою предвыборную кампанию

Избирателей заманивают в нейросети // «Новые люди» вписали искусственный интеллект в свою предвыборную кампанию Партия «Новые люди» провела 21 января отчетный слет участников проекта «Нейролаб». В организации считают, что накануне выборов в Госдуму усилия по ра …

Политика 00:20, января 22, 2026 | kommersant.ru
ChatGPT больше не консультирует  OpenAI ужесточила правила для своего ИИ

ChatGPT больше не консультирует — OpenAI ужесточила правила для своего ИИ OpenAI запретил своим моделям давать медицинские и юридические советы, чтобы избежать рисков и повысить безопасность пользователей. Похожие ограничен …

Интересное 16:20, ноября 5, 2025 | incrussia.ru
У OpenAI появляется всё больше конкурентов с более доступными и эффективными ИИ-моделями

У OpenAI появляется всё больше конкурентов с более доступными и эффективными ИИ-моделями Недавно стало известно о планах Apple и Nvidia присоединиться к Microsoft в числе инвесторов компании OpenAI, разработчика чат-бота ChatGPT с генерат …

Hardware 00:20, сентября 1, 2024 | 3dnews.ru
Нам просто нужно больше мощностей: OpenAI постепенно поборет зависимость от Microsoft

«Нам просто нужно больше мощностей»: OpenAI постепенно поборет зависимость от Microsoft OpenAI в разработке новых ИИ-моделей и предоставлении ИИ-услуг компаниям и пользователям сейчас в значительной степени полагается на вычислительные м …

Hardware 00:20, февраля 24, 2025 | 3dnews.ru
OpenAI провела тесты: новые системы ИИ ошибаются чаще прежнего

OpenAI провела тесты: новые системы ИИ ошибаются чаще прежнего Согласно публикации The New York Times, случаи, когда искусственный интеллект выдает неверные данные, называемые галлюцинациями, происходят все чаще. …

Наука и Технологии 00:20, мая 8, 2025 | astera.ru
OpenAI стала компанией общественного блага и больше не обязана играть по правилам Microsoft

OpenAI стала «компанией общественного блага» и больше не обязана играть по правилам Microsoft После более чем года переговоров OpenAI с генеральными прокурорами Калифорнии и Делавэра реструктуризация компании в конечном итоге была одобрена. Ко …

Hardware 08:20, октября 30, 2025 | 3dnews.ru
OpenAI нацелена на новые центры обработки данных в Техасе и других штатах

OpenAI нацелена на новые центры обработки данных в Техасе и других штатах Stargate, совместное предприятие OpenAI, SoftBank Group и Oracle, выбирает дополнительные площадки для открытия новых центров обработки данных в Теха …

Экономика и Финансы 08:20, февраля 10, 2025 | finam.ru