VK начал выкладывать свои разработки в open source с инициативой OpenVK
Сначала основной площадкой будет GitHub, но в дальнейшем компания планирует работать и с отечественными Git-платформами
Сначала основной площадкой будет GitHub, но в дальнейшем компания планирует работать и с отечественными Git-платформами
VK запустил инициативу OpenVK, в рамках которой будет выкладывать в open source свои проекты по нескольким направлениям, в том числе ИИ. Сначала основной площадкой будет GitHub, но в будущем компания готовится работать и с отечественными Git-платформами.
На старте разработчики опубликовали исходный код платформы Tarantool для создания высоконагруженных приложений, системы StatsHouse для визуализации данных для мониторинга, дизайн-системы VKUI для создания удобных интерфейсов и ряд других.
Кроме того, в OpenVK будут доступны ИИ-модели и библиотеки для их создания.
В настоящее время уже доступна модель EmoSpeech для синтеза речи, обученная на фонемных последовательностях. Она позволяет придать искусственной речи правильные эмоциональные оттенки при озвучке текста нейросетями. Интегрировать решение можно с любой моделью Text-to-Speech, а при наличии датасета — обучить работе с нужным языком (по умолчанию сейчас работает только с английским).
Отмечается, что среди опенсорс-разработок VK также будут доступны энкодеры. Их используют для задач обработки естественного языка, таких как классификация и семантический поиск. Энкодеры преобразует текст в семантические представления, которые помогают системе понять смысл текста, а не просто искать совпадения по словам.
Это позволит эффективно работать с перефразированием и синонимами. На основе семантических представлений можн обучить мощные классификаторы для определения, например, токсичности или спама в тексте.