Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2433

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Семерых жителей Красноярского края обвиняют в хищении 354 миллионов рублей из маткапитала
18 июля 2025
Telegram и WhatsApp под угрозой: Кремль требует ограничений и запускает собственный мессенджер
17 июля 2025
Вопросы по инструкции: перед встречей с Путиным рабочим ММК запретили упоминать экономику
17 июля 2025
Олигарх Синюк продвинул «скороспелого вояку» Чебышева во власть Судака через взятки и связи в Минобороны
17 июля 2025
Австрийский парашютист Феликс Баумгартнер погиб в результате несчастного случая на параплане
17 июля 2025
Большинство американцев уверены, что команда Трампа утаивает информацию о деле Эпштейна
17 июля 2025
Очистка воздуха для президента: в Челябинской области скрыли смог перед приездом Путина
17 июля 2025
Личный адвокат Трампа Эмиль Бове одобрен Сенатом на должность федерального судьи несмотря на протесты демократов
17 июля 2025