Наш канал в Телеграм
Новости  7.10.24   14:54 257

В GigaChat от Сбера появилась функция распознавания изображений и рукописного текста

Теперь система ИИ обрабатывает в четыре раза больше данных за один запрос

В качестве запроса пользователь сможет отправить изображение, а сервис использует его как дополнительный контекст. Модель научили определять количество людей на фото, описывать их одежду, давать совет по стилю и многое другое.

Кроме того, GigaChat Pro теперь умеет распознавать печатный и рукописный текст, графики, таблицы, формулы, а также анализировать данные, которые в них содержатся. У моделей GigaChat повысился уровень математических знаний, а GigaChat Pro научился лучше форматировать текст — расставлять параграфы, заголовки, используя выделения и списки. Эти функции окажутся полезными для школьников и студентов.

Функциональность доступна также бизнес-клиентам. С помощью ИИ компании смогут модерировать и классифицировать отзывы, систематизировать медиаконтент, автоматизировать линию поддержки, а ретейлеры смогут загружать изображение товара и просить сервис придумать к нему продающее описание.

Производительность как GigaChat Pro, так и версии GigaChat Lite значительно увеличилась. Если раньше в один запрос можно было загрузить объём текста, сопоставимый с 15 страницами A4, то теперь максимальный объём запроса вырос до 60 страниц.

Модель GigaChat Pro доступна всем пользователям через веб-версию, Telegram и ВКонтакте абсолютно бесплатно. Для доступа ко всем функциям нужно зайти через Сбер ID. Разработчикам и бизнесу модели доступны через GigaChat API.

«Мультимодальность расширяет способы и сферы применения больших языковых моделей, она же — ключевой тренд развития генеративного искусственного интеллекта. Теперь GigaChat умеет распознавать изображения — и это не просто ещё один важный шаг в развитии нашего сервиса, он открывает широкий спектр новых возможностей для наших пользователей. В том числе появляется много сценариев использования GigaChat API для бизнеса. Кроме того, увеличение размера контекста системы в четыре раза позволит поддерживать более длинные диалоги с пользователями и проще реализовывать кейсы с механикой RAG».

Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка
Источники: Сбербанк, vc.ru
Правила сообщества
  • будьте вежливы, уважайте участников;
  • старайтесь оставлять информативные, полезные и интересные комментарии;
  • соблюдайте действующее законодательство;
  • мы не приветствуем размещение промокодов и рекламы;
  • вы тоже можете стать автором или участником проекта и продвигать свои промокоды;