В Китае создан аналог мыслящей модели o1 от OpenAI

Минимальное чтение

Китайская лаборатория в сфере ИИ DeepSeek выпустила открытую версию DeepSeek-R1, так называемой модели рассуждений, которая, по утверждениям лаборатории, работает так же хорошо, как o1 от OpenAI или даже превосходит ее в некоторых бенчмарках по ряду ключевых показателей, передает издание TechCrunch.

R1 доступна на платформе разработки ИИ Hugging Face по лицензии MIT, что означает, что ее можно использовать в коммерческих целях без ограничений. Согласно DeepSeek, R1 превосходит o1 на тестах AIME, MATH-500 и SWE-bench Verified. AIME использует другие модели для оценки производительности модели, в то время как MATH-500 представляет собой набор текстовых задач. SWE-bench Verified, тем временем, фокусируется на задачах программирования.

Будучи моделью рассуждений, R1 эффективно проверяет факты сама, что помогает ей избегать некоторых ловушек, которые обычно мешают другим моделям. Тем не менее, такой подход требует больше времени для получения ответа (от нескольких секунд до нескольких минут), хотя считается более надежной в сложных областях, таких как математика, физика и различные науки.

- Advertisement -

R1 содержит 671 миллиард параметров, о чем свидетельствуют данные DeepSeek, опубликованные в техническом отчете. 


Больше на Онлайн журнал sololaki

Подпишитесь, чтобы получать последние записи по электронной почте.

Поделитесь этой статьей
Leave a Comment

Больше на Онлайн журнал sololaki

Оформите подписку, чтобы продолжить чтение и получить доступ к полному архиву.

Читать дальше