Поддержать команду Зеркала
Беларусы на войне
  1. Ситуация с курсом доллара в обменниках начала меняться
  2. «Дорожными знаками обозначаться не будут». В ГАИ появились новые системы фиксации — нарушители получат «письма счастья»
  3. Роман Протасевич, который не мог найти работу, все же нашел источник заработка
  4. Для владельцев транспорта ввели очередное изменение — подробности
  5. Вскоре подорожают некоторые жилищно-коммунальные услуги
  6. Россия планирует изменить тактику для нового наступления в Украине летом и осенью 2025 года — ISW
  7. Оздоровил за границей сотни тысяч детей, но сам умер от лейкемии. История человека, который спасал беларусов от последствий Чернобыля
  8. Власти хотят ввести новшества по пассажирским перевозкам
  9. Трамп: Может быть Путин «не хочет останавливать войну, он просто тянет меня за собой, и с ним нужно поступить по-другому»
  10. «Большущее противоречие». Почему Литва, Латвия и Польша не правы, отказываясь запускать в Беларусь пассажирские поезда. Мнение
  11. «Детали разговора останутся в стенах Ватикана». Посланники Лукашенко и Тихановской встретились на похоронах папы римского
  12. Беларусы оценили попытку властей заставить их прекратить обсуждение приезда пакистанцев. Получилось грустно и метко
  13. Что будет с теми, кто в 2020-м выходил на протесты, когда закончится срок давности по «народной» 342-й статье? Спросили аналитика


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.