Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2408
2408

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
14 июня 2025
Нетаньяху призвал иранцев к борьбе с режимом
13 июня 2025
Израиль нанес «сотни ударов» по территории Ирана
13 июня 2025
Армия Израиля сообщает о начале операции «Ам КаЛави»
13 июня 2025
Дональд Туск заявил о планах ограничить безвизовый режим для Грузии, вызвав резкую реакцию грузинского премьера
13 июня 2025
Иран публикует видео последствий ударов Израиля
13 июня 2025
Иран запустил более 100 «шахедов» по Израилю
13 июня 2025
Трамп заранее знал об атаке Израиля на Иран