Новости 11.10.24 11:00 546

Яндекс обновил технологию фотоперевода на базе YandexGPT

Новая версия поможет легко читать тексты с картинок на десятках языков

Яндекс представил новую версию технологии перевода текста на фото и изображениях на базе нейросетей. Компания одной из первых в мире применила большую языковую модель, чтобы переводить картинки с учётом контекста. Технология поможет, например, в поездке, если нужно быстро перевести меню в ресторане, или в работе, чтобы разобраться в нюансах технической документации на иностранном языке. Кроме того, Яндекс улучшил визуализацию перевода — текст теперь легче читается и больше похож на оригинальную вёрстку. Обновление уже доступно в Переводчике и Яндекс браузере, а позже появится и в Умной камере.

Модель семейства YandexGPT понимает стиль оригинального текста и может сохранить игру слов, например, на фотографиях рекламных слоганов или газетных заголовков. Новая технология на базе нейросетей позволила подбирать более точные формулировки во фразах с несколькими значениями и не переводить выражения дословно. За счёт этого выросло как качество перевода простых текстов, таких как состав косметической продукции, так и сложных — публицистических статей, энциклопедий и инструкций. Перевод на основе большой языковой модели работает также для изображений с текстом на английском.

Чтобы пользователю было удобно читать перевод текста на картинках, Яндекс улучшил его визуализацию для нескольких десятков языков. Технология стирает оригинальный текст с изображения и располагает переведённый поверх него: алгоритмы подбирают шрифт, размер и цвет букв, а также убирают различные артефакты таким образом, чтобы переведённые изображения выглядели наиболее естественно. Кроме того, текст получается контрастным, за счёт чего его читать даже легче, чем оригинал. По словам компании, технология распознаёт переносы слов и может понять их значение, даже если в кадр попала только часть.

Для перевода текста на изображениях разработчики Яндекса создали отдельную модель семейства YandexGPT, адаптированную под задачи перевода с английского на русский. Её обучали на множестве пар оригинальных и переведённых текстов.

Для того чтобы нейросеть могла быстро обрабатывать большое количество запросов пользователей, разработчики применили метод дистилляции, при котором от большой «учительской» модели семейства YandexGPT знания передаются к меньшей «ученической». Меньшая модель старается подражать поведению большой модели, и качество её ответов остаётся на уровне «учительской» при меньших вычислительных затратах.

В Яндекс Браузере появился текстовый редактор на базе нейросети YandexGPT

А также переводчик и сервис краткого пересказа

Правила сообщества

будьте вежливы, уважайте участников;
старайтесь оставлять информативные, полезные и интересные комментарии;
соблюдайте действующее законодательство;
мы не приветствуем размещение промокодов и рекламы;
вы тоже можете стать автором или участником проекта и продвигать свои промокоды;

Яндекс обновил технологию фотоперевода на базе YandexGPT

В Яндекс Браузере появился текстовый редактор на базе нейросети YandexGPT

Бесплатная поездка из Москвы в Сочи с 10 по 16 мая у каршеринга BelkaCar

«Входит оператор ЕВА». Вакханалия с рейтингом Яндекс.Драйва и феерическая поддержка

Книги в подарок и букшеринг в каршеринге BelkaCar

Кикшеринг Whoosh объявил финансовые результаты за третий квартал и 9 месяцев 2025 года

Власти планируют ввести обязательную регистрацию частных СИМ в 2026 году