Два человека погибли при столкновении "Жигулей" и фуры в Забайкалье
12:08
Ефрейтор из Забайкалья награждён медалью Жукова за обеспечение связи под огнём
12:02
Спасатели за сутки дважды деблокировали пострадавших в ДТП в Забайкалье
11:54
Мастерскую для будущих машинистов открыли в лицее Чернышевска
11:40
Губернатор Забайкалья Осипов поздравил педагогов с Днём учителя
11:31
Первая в 2025 году линия освещения на региональной трассе появилась в Забайкалье
11:02
Шесть фольклорных коллективов из Забайкалья поедут на конкурс "Казачий круг" в Бурятию
10:05
В Забайкалье стартовал проект "Ответственное родительство: диалоги о важном"
09:06
Забайкальский военный обеспечил бесперебойную связь на СВО
07:08
Самые популярные новости ChitaMedia 4 октября
4 октября, 22:34
Осадки, ветер и заморозки ожидаются в Забайкалье 5 октября
4 октября, 21:30
Депутат из Читы попал в список героев СВО на Форуме классных руководителей
4 октября, 21:04
Рестораторы предложили пригласить Ивлева на следующий гастрофестиваль в Чите
4 октября, 20:03
Новый отремонтированный участок открыли на трассе "Амур" в Забайкалье
4 октября, 19:04
Обустройство Большой Сухотинской тропы продолжается в Чите
4 октября, 18:02

Сбер выложил две собственные ИИ-модели в открытый доступ

Это весомый вклад в развитие российского и международного open-source сообщества
1 октября, 18:35 Общество
Сбер выложил две собственные ИИ-модели в открытый доступ Илья Аверьянов, ИА PrimaMedia.ru
Сбер выложил две собственные ИИ-модели в открытый доступ
Фото: Илья Аверьянов, ИА PrimaMedia.ru
Нашли опечатку?
Ctrl+Enter

Бизнес и разработчики получили открытый доступ к обновлённой модели для создания векторных представлений текста — Giga-Embeddings (18+), а также модели для генерации видео Kandinsky Video Lite (18+). Обе модели распространяются по открытой лицензии, допускающей свободное использование в коммерческих проектах любого масштаба. Об этом рассказал старший вице-президент, руководитель блока "Технологическое развитие" в рамках мероприятия "День ИИ" в Сколково, пишет ИА IrkutskMedia со ссылкой на пресс-службу банка.

"Научная команда Сбера активно публикует различные модели генеративного искусственного интеллекта. Так, в открытый доступ выложены все модели линейки Kandinsky, семейство акустических моделей для русского языка GigaAM, которые находятся "под капотом" нашего сервиса GigaChat (18+). 

Предоставление бизнесу и разработчикам новых мощных инструментов, как Kandinsky Video Lite и Giga-Embeddings, способствует ускорению темпов исследований, развитию инновационных продуктов и сервисов мирового уровня. Это демонстрирует наше стремление внести ощутимый вклад в развитие международного open-source сообщества. Кроме того, это важный этап становления стандартов в сфере обработки естественного языка (NLP), а также укрепление позиций России как технологического лидера на мировой арене", — отметил старший вице-президент, руководитель блока "Технологическое развитие" Сбербанка Андрей Белевцев.

Kandinsky Video Lite позволяет создавать короткие видео длительностью до 10 секунд на основе текстового запроса (промпта). Это компактная модель, содержащая всего два миллиарда параметров. При этом по внутренним тестам Kandinsky Video Lite превосходит по общему качеству (которое включает в себя оценки качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. Особое внимание при обучении Kandinsky Video Lite было уделено пониманию отечественного культурного кода: для этого был сформирован специальный датасет из более, чем миллиона изображений и видео — при этом существенная его часть отбиралась в несколько этапов большой командой профессиональных художников и дизайнеров. За счёт этого наша модель хорошо понимает характерные для нашей страны и её истории объекты. Мы также выкладываем ускоренную версию Kandinsky Video Lite Flash, которая работает примерно в 6 раз быстрее базовой модели.

Модели найдут широкое применение среди исследователей, разработчиков и представителей творческих профессий. Теперь создание качественных видеороликов станет доступным каждому, вне зависимости от уровня технических ресурсов или бюджета проекта.

Разработчикам и бизнесу также стала доступна в open-source обновлённая модель, преобразующая текстовую информацию в эффективные векторные представления — Giga-Embeddings. Эта модель абсолютный лидер на русском языке, она уверенно занимает первое место в общем зачёте авторитетного бенчмарка ruMTEB с результатом 74.1, значительно опережая другие открытые модели, а также показывает высочайшее качество работы и на английском языке, сохраняя конкурентоспособность на мировом уровне.

Giga-Embeddings обеспечивает построение высокоэффективных RAG-систем (Retrieval-Augmented Generation), гарантирующих надёжность и точность ответов искусственного интеллекта. Таким образом, корпоративный сектор получает мощный инструмент для повышения качества поиска по документам, аналитики данных и автоматизированной поддержки пользователей на основе актуальной информации. Разработчики с помощью модели смогут быстро создать умных помощников и чат-ботов, способствующих эффективной обработке корпоративных данных без риска появления недостоверных ответов.

Модели уже доступны для свободного использования на Hugging Face (18+), GitVerse (18+). Kandinsky Video Lite можно также найти на GitHub (18+).

Реклама. Рекламодатель — ПАО "Сбербанк". (ОГРН 1027700132195. Юридический адрес: Москва, ул. Вавилова, 19).

234715
81
131