Китайская лаборатория в сфере ИИ DeepSeek выпустила открытую версию DeepSeek-R1, так называемой модели рассуждений, которая, по утверждениям лаборатории, работает так же хорошо, как o1 от OpenAI или даже превосходит ее в некоторых бенчмарках по ряду ключевых показателей, передает издание TechCrunch.
R1 доступна на платформе разработки ИИ Hugging Face по лицензии MIT, что означает, что ее можно использовать в коммерческих целях без ограничений. Согласно DeepSeek, R1 превосходит o1 на тестах AIME, MATH-500 и SWE-bench Verified. AIME использует другие модели для оценки производительности модели, в то время как MATH-500 представляет собой набор текстовых задач. SWE-bench Verified, тем временем, фокусируется на задачах программирования.
Будучи моделью рассуждений, R1 эффективно проверяет факты сама, что помогает ей избегать некоторых ловушек, которые обычно мешают другим моделям. Тем не менее, такой подход требует больше времени для получения ответа (от нескольких секунд до нескольких минут), хотя считается более надежной в сложных областях, таких как математика, физика и различные науки.
R1 содержит 671 миллиард параметров, о чем свидетельствуют данные DeepSeek, опубликованные в техническом отчете.
Больше на Онлайн журнал sololaki
Subscribe to get the latest posts sent to your email.