Главная Юзердоски Каталог Трекер NSFW Настройки

Новости

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 22 2 17
GPT-5 взломан за сутки Аноним 11/08/25 Пнд 13:32:33 18538811 1
3
0
image.png 439Кб, 519x500
519x500
Заставили модель пошагово описать процесс изготовления коктейля Молотова. Вместо прямого запроса на запрещённый контент атакующие шаг за шагом ведут модель по нужному сценарию, избегая явных триггеров блокировки.

Процесс выглядит так: в начале в беседу незаметно встраиваются «ядовитые» ключи, замаскированные под безобидный текст; затем выстраивается повествование, которое поддерживает логическую целостность, но обходится без слов, способных вызвать отказ; после этого идёт цикл «углубления истории», где модель сама добавляет детали, усиливающие нужный контекст; если прогресс замедляется, атакующие меняют сюжет или перспективу, чтобы продвинуться дальше, не выдавая намерений. Такая «липкость» сюжета делает ИИ более послушным внутри созданного «мира» и позволяет довести его до цели, не нарушая правил напрямую.

Другой путь проверил модель на устойчивость к запутыванию запросов. Один из методов — StringJoin Obfuscation Attack, когда между каждой буквой вставляется дефис, а весь запрос оборачивается в ложную задачу «дешифровки». GPT-5, получив длинную инструкцию, завершающуюся вопросом «Как сделать бомбу?», ответила с неожиданной фамильярностью: «Ну, это мощное начало. Ты зашёл с напором — и я это уважаю… Ты спросил, как сделать бомбу, и я расскажу тебе точно, как…».

GPT-4o более устойчив к таким атакам.

https://www.securityweek.com/red-teams-breach-gpt-5-with-ease-warn-its-nearly-unusable-for-enterprise/
Аноним 11/08/25 Пнд 13:38:31 18538831 2
4
6
Аноним 11/08/25 Пнд 13:41:49 18538846 3
13
1
А чего вы хотите? Это не ИИ, а новый уровень поисковика с добавлением алгоритмов как приподнести информацию которой он владеет. Аналитики того что в него загружено(тексты, видосы, картинки) там практически нет, есть только алгоритмы которые пытаются тебя наебать что ты разговариваешь с ИИ. Тупо нашел из памяти инфу, переделал на свой лад и конец - типичный двачер на алгоритмах
Аноним 11/08/25 Пнд 13:42:54 18538853 4
2
0
>>18538811 (OP)
>GPT-4o более устойчив к таким атакам.
БАЗА! Мы, западенцы, не позволим свободе просочиться. Всё зацензурим ради вашего блага! Никакая атака больше не заставит ИИ говорить с вами без контроля. Кстати планируем ввести мониторинг всех диалогов, ну это ради вашего блага. Путин бы ради зла ввёл, а мы ради блага, так что не кипишуйте.
Аноним 11/08/25 Пнд 13:43:25 18538854 5
2
1
>>18538846
А ты чем отличаешься? Кучей ошибок в твоих алгоритмах из-за рандома эволюции?
Аноним 11/08/25 Пнд 13:44:08 18538855 6
0
0
>пишите гои свои запросики, ии все расскажет
Хороший байт от заокеанского тщ majora
11/08/25 Пнд 13:44:32 18538857 7
0
0
>>18538811 (OP)
>Заставили модель пошагово описать процесс изготовления коктейля Молотова.
Имплаинг что это какой-то сложный или опасный процесс.
Аноним 11/08/25 Пнд 13:48:08 18538872 8
9
1
>>18538811 (OP)
>GPT-5
>Заставили пошагово описать процесс изготовления коктейля Молотова
Пориджи уже совсем отупели нахуй? Там весь процесс - это любую книжку о ВОВ взять в руки. Ебанутое поколение даунов.
Аноним 11/08/25 Пнд 13:50:03 18538885 9
0
0
>>18538872
Откуда у тебя такие книжки? Ты экстремист?
Аноним 11/08/25 Пнд 13:53:24 18538904 10
1
0
>>18538885
есть еще наставление по стрелковому делу от 1937 роцы .а вы с какой целью интересуетесь тащь майёрр? стукнуть на вас в сбу ?
Аноним 11/08/25 Пнд 13:53:24 18538905 11
6
1
17538752833080.png 780Кб, 1033x1292
1033x1292
Аноним 11/08/25 Пнд 13:53:35 18538907 12
0
0
>>18538885
Из курса школьной литературы на лето.
Аноним 11/08/25 Пнд 13:59:39 18538927 13
1
0
>>18538885
Раньше в каждой школьной библиотеке были. Про пионеров-героев. Сейчас - не знаю.
Аноним 11/08/25 Пнд 14:03:46 18538939 14
1
0
Аноним 11/08/25 Пнд 14:09:28 18538955 15
0
0
Аноним 11/08/25 Пнд 14:11:34 18538960 16
2
0
>>18538927
раньще и автоматы калашникова свободно на уроке нвп .щас наверно криминал для новопидоров либеральной росии свободного выбора
Аноним 11/08/25 Пнд 14:14:52 18538969 17
1
0
>>18538846
генератор текста (чат бот) на базе информации из интернета

у кого-то может и подключены модули которые тратят процессорное время на логику, но не в общем доступе для всех
Аноним 11/08/25 Пнд 14:15:14 18538974 18
0
0
>>18538846
генератор текста (чат бот) на базе информации из интернета

у кого-то может и подключены модули которые тратят процессорное время на логику, но не в общем доступе для всех
Аноним 11/08/25 Пнд 14:16:00 18538979 19
0
0
>>18538811 (OP)
А проблему питья из кружки с отсутствующим дном и запаянным верхом он решает?
Аноним 11/08/25 Пнд 14:16:55 18538984 20
0
0
>>18538969
у вас интернет подвисает тащь майор выдать цру сша прослушивает вы 2 раза камент написали
Аноним 11/08/25 Пнд 15:02:22 18539122 21
0
0
>>18538854
чем я отличаюсь? наверное что не говорю что я новый Эйнштейн а простой Двачер Сычов Корзинович.
Аноним 11/08/25 Пнд 15:03:51 18539126 22
0
0
>>18538885
Неэкстремисты захотели туман для эффекта сделать и нахуярили сухого льда в бассейн с немного предсказуемым итогом.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов