Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2399

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Следователи пришли к топ-менеджерам
24 июня 2024
Чемезов подМиГнул Мащицкому?
24 июня 2024
Хирурги Елагин и Кадзаев ответят за смерть пациента, пока Хайдаров находит новое место работы
24 июня 2024
Самый молодой депутат Новой Зеландии исполнила ритуальный танец маори во время первой речи в парламенте
06 января 2024
Саратовский Фонд капремонта тратит десятки миллионов на юристов и рассылку платежек. Тендеров на ремонты в 2023 году не было вовсе
04 января 2024
Порядок в ЗАГСах Петербурга наведет «Чистая линия»
02 января 2024
"Битцевский маньяк" Александр Пичушкин будет этапирован в Москву для участия в следственных действиях
16 апреля 2025
Глава департамента туризма Свердловской области Туканова закрыла глаза на несуществующую инфраструктуру Baden Family
16 апреля 2025
«Уралвагонзавод» сопротивляется возврату субсидий Минпромторгу, скрывая провалы в госпрограммах
16 апреля 2025
Российский военный расстрелял четырех сослуживцев в Донецке
15 апреля 2025
Белгородский глава района Александр Полубатько отметился на СВО без реального боевого опыта
15 апреля 2025
OpenAI разрабатывает социальную сеть по типу X
15 апреля 2025
Основатель Help Ukraine получил 5,5 лет за присвоение средств, выделенных на помощь беженцам
15 апреля 2025