Резюме создано Smart Answers AI
В итоге:
- Новая флагманская модель OpenAI GPT-5.4 представляет возможности агентного искусственного интеллекта, которые могут напрямую управлять функциями ПК, такими как нажатие, редактирование файлов и управление электронными таблицами.
- PCWorld сообщает, что эта разработка знаменует собой значительный сдвиг в сторону автономных агентов искусственного интеллекта, выполняющих компьютерные задачи без вмешательства человека.
- Расширенные функции доступны через OpenAI API и платформы Codex, что представляет собой значительный шаг вперед по сравнению с традиционным диалоговым взаимодействием с искусственным интеллектом.
Помните, когда модели ИИ могли только подсказать вам, что делать? Теперь новейшие программы LLM действительно могут делать все с помощью агентного программного обеспечения искусственного интеллекта, а новая флагманская модель OpenAI — новейшая из всех.
GPT-5.4 сейчас доступен в ChatGPT (где он называется GPT-5.4 Thinking), а также в OpenAI API и инструменте кодирования OpenAI Codex (версия которого только что вышла для Windows).
Этот новый GPT поставляется с рядом новых и обновленных приемов, начиная с улучшенных навыков работы с электронными таблицами, более эффективного рассуждения (это означает, что он может решать проблемы, используя меньше токенов, что обходится вам дешевле) и способности показывать вам «предварительный» план перед выполнением сложных задач, давая вам возможность направить модель в новом направлении, прежде чем она начнет работать.
Самое интересное, что GPT-5.4 представляет собой первую модель общего назначения OpenAI, которая действительно может делать вещи на вашем компьютере, а не просто сказать вам как делать дела. Например, GPT-5.4 может щелкнуть мышью — или, если быть более точным, он может подать команду «щелкнуть мышью» системе агента искусственного интеллекта на вашем ПК, которая и выполняет фактический щелчок. GPT-5.4 также может редактировать файлы в вашей системе, вводить команды с клавиатуры и «видеть» снимки экрана (что позволяет ему использовать веб-браузер или взаимодействовать с компьютерными программами).
Теперь важное предостережение: GPT-5.4 может взять на себя управление вашим компьютером только тогда, когда он работает через OpenAI API или инструмент OpenAI Codex. Когда вы используете GPT-5.4 «Мышление через ChatGPT», то есть настольное приложение ChatGPT или веб-интерфейс, LLM по-прежнему ограничен своим окном чата и различными интеграциями ChatGPT, такими как Google Drive, Spotify, Adobe Photoshop и другие.
Также стоит отметить, что хотя GPT-5.4 является первым общего назначения GPT, который действительно может использовать ваш компьютер, это не первый GPT всегда это может сделать это. Существуют специальные GPT, предназначенные для Кодекса, которые могут выполнять команды, редактировать файлы и (в некоторой степени) перемещаться по графическим интерфейсам и встраиваться в рабочие процессы в сети. Но благодаря своей способности просматривать веб-страницы и управлять программами для ПК GPT-5.4 выводит возможности «использования компьютера» более ранних моделей, ориентированных на Кодекс, на новый уровень.
Это означает, что вы могли бы попросить ИИ-агента, управляемого GPT-5.4, на вашем компьютере «сбалансировать мои книги в Quicken», и он сможет автономно запускать приложение Quicken, щелкать по интерфейсу и балансировать ваши учетные записи.
Конечно, если бы вы хотеть Самостоятельно возиться с GPT 5.4 в Quicken — это вообще отдельный вопрос. Для деликатных задач вам, вероятно, захочется посмотреть через плечо, как он работает, как вы можете это сделать при кодировании с помощью GPT-5.4 в приложении Codex.
Тем не менее, возможности GPT-5.4 «делать, а не просто говорить» служат прекрасным примером того, куда мы движемся: ПК, управляемые агентами ИИ, которые делают что-то самостоятельно, под нашим руководством на высоком уровне. Тем не менее, заставить наших агентов ИИ следовать нашим указаниям. правильно это будет настоящий трюк.


