«Мне пришлось БЕГАТЬ к своему Mac mini, как будто я обезвреживал бомбу»: OpenClaw AI решил «ускориться», удалив почтовый ящик директора по безопасности Meta AI из-за «ошибки новичка»

В прошлом месяце я проверил шумиху вокруг Moltbot, AKA Clawdbot, AKA OpenClaw (третий раз прелесть?). Я потратил много времени, подчеркивая потенциальные риски безопасности, связанные с использованием нового популярного искусственного интеллекта. И теперь похоже, что Саммер Юэ, директор по безопасности и согласованию в Meta Superintelligence, лично почувствовала эти потенциальные риски.

По словам Юэ, она наблюдала, как ИИ-бот «ускорял» удаление ее почтового ящика, и не могла остановить это со своего телефона:

Ничто так не унижает вас, как сказать вашему OpenClaw «подтвердить, прежде чем действовать» и наблюдать, как он ускоряется, удаляя ваш почтовый ящик. Я не мог остановить это со своего телефона. Мне пришлось БЕГАТЬ к своему Mac mini, как будто я обезвреживал бомбу. pic.twitter.com/XAxyRwPJ5R23 февраля 2026 г.

«Ничто так не унижает вас, как сказать вашему OpenClaw «подтвердить, прежде чем действовать» и наблюдать, как он ускоряется, удаляя ваш почтовый ящик. Я не мог остановить это со своего телефона. Мне пришлось БЕГАТЬ к своему Mac mini, как будто я обезвреживал бомбу».

Я далек от того, чтобы судить о глупой ошибке, поскольку сам в некоторой степени знаток таких вопросов, но это не совсем та ошибка, которую вы ожидаете от директора по безопасности ИИ. Пользователь One X прокомментировал то же самое, спросив, не совершила ли она ошибку новичка, и Юэ ответил:

«Честно говоря, ошибка новичка. Оказывается, исследователи выравнивания не застрахованы от смещения. Стал слишком самоуверенным, потому что этот рабочий процесс работал над моим игрушечным почтовым ящиком в течение нескольких недель. Настоящие почтовые ящики работают по-другому».

Что особенно сбивает с толку, так это то, что, очевидно, если вы скажете «стоп», бот ИИ должен прервать все, что он делает:

@summeryue0, если вы только что сказали «стоп», он прервет все, что делает. Скажите «стоп» несколько раз, если в очереди несколько задач. pic.twitter.com/8csgbBxaS1 23 февраля 2026 г.

На скриншотах Юэ ее чата с OpenClaw видно, как она пытается выполнить некоторые команды, чтобы остановить его, моя любимая из которых — начальная команда «не делай этого», команда, которую, кажется, OpenClaw блаженно выполнила. Она попробовала несколько вариантов команды «стоп», но не самого слова.

Конечно, всегда есть вероятность, что ничего из этого вообще не существует. Кажется немного странным, что не было попытки выполнить простую команду «стоп» самостоятельно; Я чувствую, что это будет самое первое, что я попробую. Но эй, я полагаю, мы никогда не знаем, как мы отреагируем в момент паники.

Когда я изучил это еще в январе, я пришел к выводу, что количество потенциальных проблем с безопасностью означает, что пробовать ClawdBot не стоит. Не могу сказать, что это сделало меня более увлеченным. Но я полагаю, что я не из тех «индивидуальных предпринимателей» и им подобных, которые действительно могут получить от этого выгоду. Если вы все-таки попробуете, просто запомните команду «стоп».

Лучший игровой комплект для ПК 2026 года

When an unknown printer took a galley and scrambled it to make a specimen book not only five When an unknown printer took a galley and scrambled it to five centuries.

О нас

Categories

Our Location

Добавить комментарий Отменить ответ

Categories

Recent Post

По словам фаната, в Crimson Desert есть одна вещь, которую вы не можете сделать

Address

Corporate Office

О нас

Categories

Our Location

Social

Share This Post:

Добавить комментарий Отменить ответ

Вам понравится