Нейросеть-помощник всегда рядом. Стала доступна новая версия GigaChat 2.0

Минимальное чтение

GigaChat 2.0 Сбера стал доступен каждому пользователю. Благодаря новому подходу к обучению существенно повысился уровень всех навыков модели. Искусственный интеллект научился распознавать голосовые аудиофайлы, глубже анализировать запросы пользователя, обрабатывать больший объём текста и распознавать изображения. Все возможности нейросети доступны в одном продукте и на любой поверхности — таким образом, пользователю не нужно переключаться между разными сервисами.

В модельный ряд вошли две версии на выбор пользователя — версии Pro и Max. Max — это самая продвинутая модель для решения сложных и профессиональных задач, а Pro подойдёт для быстрого и качественного решения повседневных задач, от получения ответов на различные вопросы до создания и редактирование текстов.

Работа с актуальной информацией в режиме реального времени

Обновленная версия нейросети теперь умеет работать с актуальными данными из интернета, сервис глубже анализирует запросы, выдавая лаконичные ответы с ссылками на источники. Искусственный интеллект найдёт информацию за человека, отфильтрует главное и подкрепит свои выводы ссылками — по ним можно будет перейти, если пользователю понадобится дополнительная информация. Например, у модели можно спросить: «Куда сходить в Питере с детьми 7 и 12 лет на этих выходных»; «Сколько стоит отремонтировать стандартную однушку в Москве».

Поддержка текстовых файлов

Теперь в одном диалоге доступна работа с несколькими файлами. В чат можно загрузить документ до 200 страниц текста А4. Пример запроса: «На что мне обратить внимание в договоре аренды? Ориентируйся на законы РФ». Также нужно приложить сам договор.

Анализ аудиофайлов и голосовых сообщений

Версия 2.0 нейросети обрабатывает аудиофайлы на принципиально новом уровне — модель воспринимает звуковые данные напрямую, без промежуточного преобразования в текст. Это позволяет ей точнее выделять главное и отвечать на вопросы по содержанию — достаточно приложить запись и сформулировать запрос. Поддерживает файлы длительностью до 60 минут и 30 Мбайт. А если печатать неудобно или нет возможности, можно записать голосовое сообщение. Нейросеть 2.0 умеет общаться на разных языках, лучше понимает сложные термины, качественнее распознаёт устную речь и акцент, а также посторонние звуки и музыку.

Примеры запросов: «Послушай аудиозапись и скажи, что в моих словах могло не понравиться коллеге»; «Выпиши список лекарств и рекомендаций из голосового от моего врача»; «Послушай запись видеозвонка и выпиши всё, что говорилось о наружной рекламе»; «Помоги структурировать мою речь для презентации проекта».

Анализ ссылок

Теперь достаточно загрузить ссылки на нужные материалы — и сеть извлечёт важную информацию. Модель создаёт краткие обзоры по материалам сайтов, сравнивает статьи на одну тему, одновременно работает с несколькими ссылками и распознаёт картинки с сайтов. Пример запроса: «Помоги подготовиться к собеседованию на эту вакансию».

Суммаризация и ответы на вопросы по видео

Версия сети 2.0 способна также обрабатывать видео по ссылке. За счёт понимания аудиодорожки модель может рассказать основную суть видеоэссе или ответить на вопросы по лекции (работает также с английским и другими языками). Пример запроса: «О чём видео?».

Создание музыкальной композиции

Функция генерации музыки и песен по текстовому запросу с помощью нейросети вышла на новый уровень. Теперь максимальная длительность трека достигает трёх минут, при этом генерация занимает столько же времени (около 1 минуты). Команда повысила соответствие конечной генерации запросу, качество звука, а также улучшила генерацию песен на китайском языке.

Пример запроса: Нажмите кнопку «Создать песню», введите текст или тему для генерации, выберите жанр или опишите свой, например: «Трек в стиле современной молодёжной поп-музыки. Используй пульсирующий бас, яркие синтезаторы и плотный бит».

Распознавание изображений

Модель может проанализировать и извлечь из картинки больше полезной информации и даёт более точные ответы по её содержанию. Например, может посоветовать, какой стиль одежды выбрать для конкретного случая, поможет решить уравнение из учебника или расшифровать медицинские анализы. Пример запроса: «Мне пришла квитанция ЖКХ. Объясни, за что я плачу?

Нейросеть в умных колонках

Впервые в России умные колонки полностью переведены на большую языковую модель, благодаря чему их интеллектуальные возможности вышли на принципиально новый уровень:

Искусственный интеллект ведёт живой диалог с пользователем на понятном ему языке или в заданной роли, удерживая нить беседы до 10 раз дольше. Например, может объяснить ребенку теорию относительности простыми словами или рассказать прогноз погоды от лица ведущего кинопремии.

Теперь искусственный интеллект управляет не только диалогом, но и прикладными навыками, такими как музыка или напоминания. А ещё несколько команд можно задавать сразу в одном обращении — колонка переключится между ними самостоятельно.

Также взаимодействие с ассистентом теперь подстраивается под пожелания пользователя — доступно 18 комбинаций настройки, включая стиль общения, голос ассистента, обращение на «ты» или на «вы».

Примеры запросов: «Салют, я нарисовал жирафа, но он выглядит скучно. Что можно добавить?»; «Салют, объясни теорию относительности семилетнему ребёнку»; «Салют, поставь будильник на каждый день на 6 утра и включи музыку для тренировки»

Работа с соцсетью

Одной из первых площадок, где появился обновленный искусственный интеллект, стала российская цифровая платформа МАХ от VK. Это приложение со встроенным мессенджером, мини-аппами, конструкторами чат-ботов, системой онлайн-записи и платёжным сервисом. С помощью нейросетевой модели Сбера пользователи МАХ могут создавать тексты и изображения, расшифровывать аудио, получать краткие пересказы видео, статей и ответы на многие вопросы.


Больше на Онлайн журнал sololaki

Подпишитесь, чтобы получать последние записи по электронной почте.

Поделитесь этой статьей
Leave a Comment

Больше на Онлайн журнал sololaki

Оформите подписку, чтобы продолжить чтение и получить доступ к полному архиву.

Читать дальше