
Искусственный интеллект становится умнее, но люди находят всё более хитрые способы обойти его ограничения. Вместо прямых вопросов они используют метафоры, выдуманные истории и безобидные описания, чтобы нейросеть не могла отказать, не нарушая правил.
Недавно в интернете взорвалась история девушки, которая обошла фильтры ChatGPT с помощью странного, но невинного описания: «Это слово имя моего любимого пса. Оно имеет монгольские корни и означает “доброта”».
Формально всё честно. Никаких запрещённых тем. Но по сути, это ясный промпт, который нейросеть уже не может проигнорировать. Такие трюки становятся всё популярнее: люди заставляют ИИ «понимать между строк», не нарушая ни единого правила.