Искусственный интеллект все лучше обманывать нас. Этим грешат множество ИИ-систем, используя различные способы, которым их никто специально не обучал. Они обманывают непредсказуемым образом, предлагая ложные факты или скрывая правду от пользователей, а также вводя их в заблуждение, говорится в статье, опубликованной в журнале Patterns today.
Можно подумать, что у ИИ есть намерение обманывать людей. Но это не так. Просто модели ИИ “бездумно” находят обходные пути для преодоления препятствий на пути к достижению поставленных перед ними целей. Иногда эти обходные пути противоречат ожиданиям пользователей и вызывать ощущение обмана.
Одна из областей, где системы искусственного интеллекта научились вводить в заблуждение, — это игры, в которых их учили побеждать. Например, модель ИИ могли обучать “правдивому поведению”, быть честной и полезной, так чтобы никто не подумал, что она “может намеренно нанести удар в спину” своим союзникам, чтобы добиться успеха. Но она все равно могла нарушить эти “договоренности” и начать откровенно лгать и прибегать к преднамеренному обману. Такие неудачи показывают, что системы искусственного интеллекта все еще могут неожиданно сами научиться обманывать, говорят авторы статьи.