OpenAI провела тесты: новые системы ИИ ошибаются чаще прежнего

OpenAI провела тесты: новые системы ИИ ошибаются чаще прежнего
00:20, мая 8, 2025 Согласно публикации The New York Times, случаи, когда искусственный интеллект выдает неверные данные, называемые галлюцинациями, происходят все чаще. Издание приводит пример: бот технической поддержки инструмента Cursor сообщил пользователям ложную информацию о запрете использования сервиса на нескольких устройствах. Впоследствии руководство компании опровергло эти данные. Отмечается, что даже самые современные системы от OpenAI, Google и DeepSeek демонстрируют рост количества ошибок. Несмотря на улучшение математических способностей, умение работать с фактами у новых ИИ-моделей снизилось. Причины этого технологические компании пока объяснить не могут. Системы искусственного интеллекта строятся на математических вероятностях и не обладают механизмами различения правды и лжи. В некоторых тестах, по данным The New York Times, частота галлюцинаций достигала 79%. Представители компаний признают, что полностью исключить ошибки невозможно. Особую обеспокоенность вызывает использование ИИ в таких сферах, как право, медицина и бизнес, где ошибки могут привести к значительным последствиям. По данным OpenAI, их новейшая система o3 допустила ошибки в 33% случаев при тестировании на знание публичных личностей, а более новая версия o4-mini — в 48%. В другом тесте, SimpleQA, частота ошибок достигла 79%. Тестирования показывают, что аналогичные проблемы фиксируются у моделей других компаний, включая Google и DeepSeek. Причиной роста числа ошибок специалисты называют особенности новых методо...
Источник: astera.ru
 
 

Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Названы имена, в которых чаще всего ошибаются в загранпаспортах

Названы имена, в которых чаще всего ошибаются в загранпаспортах В мае и июне участились случаи изъятия заграничных паспортов при выезде из РФ. Об этом заявил вице-президент Российского союза туриндустрии (РСТ) Дми …

Главные новости 18:42, июня 12, 2024 | life.ru
OpenAI провела зачистку ChatGPT от аккаунтов из Китая и Северной Кореи, подозреваемых во вредоносной деятельности

OpenAI провела зачистку ChatGPT от аккаунтов из Китая и Северной Кореи, подозреваемых во вредоносной деятельности OpenAI заблокировала аккаунты пользователей из Китая и Северной Кореи, которые, якобы, использовали технологии компании в злонамеренных целях, включа …

Hardware 00:20, февраля 24, 2025 | 3dnews.ru
OpenAI признала: o3 и o4-mini чаще галлюцинируют, чем o1

OpenAI признала: o3 и o4-mini чаще «галлюцинируют», чем o1 Ожидавшиеся как более точные и «умные», свежие ИИ-модели OpenAI серии o-серии неожиданно продемонстрировали обратный результат: по собственным тестам …

Наука и Технологии 08:20, апреля 20, 2025 | itzine.ru
Путин объявил, что Россия провела испытания экспериментальной баллистической ракетной системы Орешник  и нанесла удар по Днепру

Путин объявил, что Россия провела испытания экспериментальной баллистической ракетной системы «Орешник» — и нанесла удар по Днепру продолжениеПутин: «Мы вправе применять оружие против военных объектов стран, которые позволяют применять свое оружие против России» Президент РФ Влад …

Главные новости 08:20, ноября 22, 2024 | meduza.io
GPU Blackwell: NVIDIA поставляет первые системы для OpenAI и Microsoft

GPU Blackwell: NVIDIA поставляет первые системы для OpenAI и Microsoft В 2025 году NVIDIA планирует поставить сотни тысяч графических процессоров Blackwell, производство которых должно быть в полном разгаре после небольш …

Наука и Технологии 16:20, октября 12, 2024 | hardwareluxx.ru
OpenAI ведет разработку системы контекстной рекламы в ChatGPT

OpenAI ведет разработку системы контекстной рекламы в ChatGPT Компания OpenAI изучает возможность внедрения рекламных форматов в интерфейс ChatGPT. Об этом сообщают источники издания The Information. По их данны …

Наука и Технологии 00:20, декабря 28, 2025 | astera.ru
OpenAI запустил полную версию своей поисковой системы SearchGPT

OpenAI запустил полную версию своей поисковой системы SearchGPT Стартап OpenAI запустил полную версию собственной поисковой системы SearchGPT, которая постепенно станет доступна бесплатно для всех пользователей ча …

Экономика и Финансы 00:20, ноября 1, 2024 | finam.ru
СМИ: EA закрыла студию авторов игры про Черную Пантеру и провела новые увольнения

СМИ: EA закрыла студию авторов игры про Черную Пантеру и провела новые увольнения Electronic Arts (EA) продолжает прореживать штат, сообщает портал IGN со ссылкой на внутреннее письмо от президента подразделения EA Entertainment Ло …

Наука и Технологии 00:20, июня 3, 2025 | app2top.ru