Китайские компании выпустили новые модели искусственного интеллекта
![Китайские компании выпустили новые модели искусственного интеллекта]()
Новые крупные языковые модели представили китайские интернет-гиганты и стартапы в области искусственного интеллекта, сообщает 22 января издание Yicai.
Сообщается, что некоторые из них могут решать задачи по математике и кодированию не хуже, чем последняя модель OpenAI O1. 20 января DeepSeek представила модель DeepSeek-R1, а чуть более часа спустя Moonshot AI запустила модель Kimi K1.5. В тот же день шанхайская компания MiniMax запустила аудиофункции для своей платформы Hailuo AI text-to-video, а компания ByteDance Doubao представила голосовую модель реального времени, которая может выступать в роли учителя английского языка или рассказчика для пользователей.
Moonshot AI из Пекина утверждает, что Kimi K1.5 догнала OpenAI O1, которая дебютировала в прошлом месяце, в математике, кодировании и возможностях мультимодального мышления. Аналогичным образом, компания DeepSeek из Ханчжоу заявила, что DeepSeek-R1 работает наравне с O1 в таких задачах, как математика, кодирование и умозаключения на естественном языке.
Китайские программы также менее дороги. DeepSeek предлагает услуги интерфейса прикладного программирования по цене 1 юань ($0,1) за миллион входных токенов и 16 юаней ($2,20) за миллион выходных токенов, что значительно ниже, чем у O1 — $15 и $60 соответственно.
Последние обновления Moonshot AI и DeepSeek в целом соответствуют направлению выводов в серии O1 от OpenAI, но могут не использовать идентичные технические решения, сказал сотрудник отдела исследований и разработок ведущей китайской LLM-компании. Китайские компании переходят на модели с открытым исходным кодом, в то время как OpenAI, американский разработчик ChatGPT, придерживается стратегии проприетарного исходного кода.
Например, Moonshot AI впервые опубликовала технический отчет об обучении модели, а DeepSeek раскрыла весовые коэффициенты модели. Джим Фан, старший менеджер по исследованиям в Nvidia, высоко оценил переход DeepSeek к совместным инструментам разработки ИИ.
«Мы живем в такое время, когда неамериканская компания поддерживает первоначальную миссию OpenAI — действительно открытые, пограничные исследования, которые расширяют возможности всех. В этом нет никакого смысла. Самый занимательный исход — самый вероятный», — написал Фан на сайте X 20 января.
«DeepSeek-R1 не только открывает исходный код множества моделей, но и раскрывает все секреты обучения. Это, пожалуй, первый проект OSS, который демонстрирует значительный и устойчивый рост маховика RL», — добавил Фан, имея в виду систему обучения с подкреплением, которая получает вознаграждение за успешное взаимодействие, что приводит к положительной обратной связи.
Более того, гигант социальных сетей и игр Tencent Holdings вчера выпустил свою модель Hunyuan3D 2.0, модель с открытым исходным кодом, преобразующую 2D-изображения в 3D-изображения, которая, как ожидается, найдет применение в разработке игр, рекламе в электронной коммерции и промышленном производстве.
Китайский технологический гигант Baidu также недавно начал тестировать новое ИИ-приложение под названием Free Canvas, инструмент для создания досок на базе облачной платформы компании и Baidu Wenku, электронной библиотеки, которая превратилась в генератор ИИ-контента. Число ежемесячных активных пользователей Baidu Wenku превысило 90 миллионов, сообщил Ванг Йинг, вице-президент поискового оператора.

Новые крупные языковые модели представили китайские интернет-гиганты и стартапы в области искусственного интеллекта, сообщает 22 января издание Yicai.
Сообщается, что некоторые из них могут решать задачи по математике и кодированию не хуже, чем последняя модель OpenAI O1. 20 января DeepSeek представила модель DeepSeek-R1, а чуть более часа спустя Moonshot AI запустила модель Kimi K1.5. В тот же день шанхайская компания MiniMax запустила аудиофункции для своей платформы Hailuo AI text-to-video, а компания ByteDance Doubao представила голосовую модель реального времени, которая может выступать в роли учителя английского языка или рассказчика для пользователей.
Moonshot AI из Пекина утверждает, что Kimi K1.5 догнала OpenAI O1, которая дебютировала в прошлом месяце, в математике, кодировании и возможностях мультимодального мышления. Аналогичным образом, компания DeepSeek из Ханчжоу заявила, что DeepSeek-R1 работает наравне с O1 в таких задачах, как математика, кодирование и умозаключения на естественном языке.
Китайские программы также менее дороги. DeepSeek предлагает услуги интерфейса прикладного программирования по цене 1 юань ($0,1) за миллион входных токенов и 16 юаней ($2,20) за миллион выходных токенов, что значительно ниже, чем у O1 — $15 и $60 соответственно.
Последние обновления Moonshot AI и DeepSeek в целом соответствуют направлению выводов в серии O1 от OpenAI, но могут не использовать идентичные технические решения, сказал сотрудник отдела исследований и разработок ведущей китайской LLM-компании. Китайские компании переходят на модели с открытым исходным кодом, в то время как OpenAI, американский разработчик ChatGPT, придерживается стратегии проприетарного исходного кода.
Например, Moonshot AI впервые опубликовала технический отчет об обучении модели, а DeepSeek раскрыла весовые коэффициенты модели. Джим Фан, старший менеджер по исследованиям в Nvidia, высоко оценил переход DeepSeek к совместным инструментам разработки ИИ.
«Мы живем в такое время, когда неамериканская компания поддерживает первоначальную миссию OpenAI — действительно открытые, пограничные исследования, которые расширяют возможности всех. В этом нет никакого смысла. Самый занимательный исход — самый вероятный», — написал Фан на сайте X 20 января.
«DeepSeek-R1 не только открывает исходный код множества моделей, но и раскрывает все секреты обучения. Это, пожалуй, первый проект OSS, который демонстрирует значительный и устойчивый рост маховика RL», — добавил Фан, имея в виду систему обучения с подкреплением, которая получает вознаграждение за успешное взаимодействие, что приводит к положительной обратной связи.
Более того, гигант социальных сетей и игр Tencent Holdings вчера выпустил свою модель Hunyuan3D 2.0, модель с открытым исходным кодом, преобразующую 2D-изображения в 3D-изображения, которая, как ожидается, найдет применение в разработке игр, рекламе в электронной коммерции и промышленном производстве.
Китайский технологический гигант Baidu также недавно начал тестировать новое ИИ-приложение под названием Free Canvas, инструмент для создания досок на базе облачной платформы компании и Baidu Wenku, электронной библиотеки, которая превратилась в генератор ИИ-контента. Число ежемесячных активных пользователей Baidu Wenku превысило 90 миллионов, сообщил Ванг Йинг, вице-президент поискового оператора.