В мае Яндекс представил нейросеть для генерации текста YandexGPT. В этой статье разбираемся, может ли она составить конкуренцию известной ChatGPT, а также сравниваем возможности текстовых нейросетей на практике.
Как устроены ChatGPT и YandexGPT
ChatGPT. Доступ к нейросети открыли в ноябре 2022 года. Она обучена на 420 гигабайтах текстовой информации, собранной до ноября 2021 года. Если коротко, то механика работы такая: ChatGPT «усвоила» большой объем данных и, когда получает запрос от пользователя, анализирует изученную информацию и дает на ее основе ответ. В общих чертах механика похожа на работу человеческого мозга. Поскольку нейросеть обучена на данных до 2021 года, чего-то более нового она попросту не знает.
YandexGPT. Яндекс открыл доступ к нейросети весной 2023 года — пока только в тестовом режиме. Механика работы схожа с ChatGPT, но менее прозрачна — Яндекс не раскрывает, на каких данных обучалась нейросеть. Компания рассказала лишь, что обучала ее в два этапа: сначала на общедоступных текстах, а потом на примерах содержательных и хорошо написанных ответов от AI-тренеров. Какие объемы данных использовали и насколько они актуальны, неизвестно.
Вывод. Механика одинаковая, но данные для обучения могут быть сильно различаться. Это влияет на полноту ответов нейросетей.
Что умеют ChatGPT и YandexGPT
Языковые нейросети генерируют готовый текст по запросам, или промтам, — от написания статей до составления плана питания или тренировок. Поскольку обе нейросети умеют поддерживать контекст беседы, запоминают детали разговора и реагируют на уточняющие вопросы, их можно использовать и для других задач. Вот несколько примеров:
- анализ данных и сбор саммари;
- перевод текста на другой язык;
- подготовка контент-плана;
- использование нейросети как альтернативного поисковика для ресерча.
Весной 2023 года появилась платная версия ChatGPT 4, которая среди прочего научилась анализировать информацию с сайтов в режиме реального времени. Но в бесплатной версии такой функции все еще нет — она по-прежнему владеет данными только до 2021 года включительно.
Разработчики, создатели контента, исследователи уже используют нейросети в повседневных задачах: проверяют код, создают посты, ищут источники информации. Речь идет не только об отдельных специалистах, но и о крупных компаниях. Coca-Cola использует ChatGPT и нейросеть для генерации картинок DALL-E в маркетинге. В приложение для изучения иностранного языка Duolingo внедрили нейросеть GPT-4, чтобы объяснять непонятные моменты в обучении и имитировать собеседника.
Вывод. В общих чертах они умеют одно и то же, но различаются качеством ответов (об этом речь пойдет ниже). YandexGPT все еще находится в тестовой версии и постоянно обновляется. Например, изначально она не распознавала контекст беседы, но в июне эту функцию добавили.
Как пользоваться ChatGPT и YandexGPT
ChatGPT доступна через официальный сайт, нужно зарегистрироваться по номеру телефона. Российские номера для этого не подходят, но есть несколько альтернативных способов, самый удобный из которых — подключение виртуального иностранного номера через сервисы наподобие Online Sim. С ним получится зарегистрироваться на сайте.
ChatGPT выглядит как диалоговое окно. В своем профиле можно создать сразу несколько чатов под разные темы и делиться ими с другими пользователями.
Также ChatGPT можно пользоваться через сторонние сервисы-посредники, например, Chad — чаще всего они платные, но есть пробный период. Такие сервисы подключены к официальному ChatGPT и предлагают пользователям из России использовать его возможности.
Еще можно попробовать использовать ChatGPT через ботов в Telegram. Официальных ботов нет, и сразу невозможно понять, подключен ли бот к GPT или другим нейросетям.
В мае вышло бесплатное приложение ChatGPT для iOS, которое повторяет возможности веб-версии чат-бота, но оно пока доступно только пользователям в США.
YandexGPT пока можно использовать только через голосового помощника Алису: в приложении или браузере. Можно задавать вопросы текстом, а можно — голосом. Чтобы запустить голосовой помощник, надо сказать «Алиса, давай придумаем!».
YandexGPT также встроили в приложение Шедеврум — нейросеть по генерации картинок. С помощью функции пользователи могут получить в ответ на текстовый запрос не только картинки, но и посты с подходящей по смыслу иллюстрацией. Но для полноценных запросов приложение не подходит. В компании обещают, что в ближайшее время новая модель станет частью и других сервисов Яндекса.
Также в июне Яндекс открыл прием заявок на тестирование YandexGPT для бизнеса. Компании могут подать заявку и получить доступ к API.
Вывод. ChatGPT — полноценный отдельный продукт. Пользователи из России могут пользоваться нейросетью через официальный сайт или посредников. Через сайт пользоваться удобнее: история запросов сохраняется и можно разбивать их по группам. YandexGPT пока похож на приложение, созданное под экосистему Яндекса — оно дополняет уже существующие сервисы Яндекса. Если закрыть вкладку с чат-ботом, история запросов не сохранится, что не очень удобно.
Примеры использования
Запрос 1: объяснение сложных терминов
Мы попросили нейросети объяснить нам термины из разных областей: физика (материя), психология (когнитивные искажения), история (абсолютизм), экономика (волатильность). Задача была быстро погрузиться в тему, получить общее представление о термине и примеры его применения в повседневной жизни. Запрос выглядел так: «Объясни, что такое когнитивные искажения простыми словами и с примерами».
Вывод. YandexGPT писал ответы быстрее, чем ChatGPT. При этом GPT дал более полные ответы на темы физики, истории и экономики, а примеры были понятнее. Примеры, которые приводил YandexGPT, показались немного «топорными» и не всегда связанными и поясняющими вопрос. Например, при объяснении понятия «материя» нейросеть приводила примеры на основе того, можно ли их потрогать. При этом один из примеров — воздух, который потрогать, очевидно, нельзя (YandexGPT это признает).
В примере абсолютизма нейросеть рассказала об Иване Грозном, который обладал неограниченной властью. Но в пример она привела только казни без суда — будто этим абсолютизм ограничивался.
Запрос 2: написать деловое письмо
Мы дали нейросети вводные данные: область работы компании, от имени которой пишется письмо, ассортимент, цифры продукции и ее особенности. Главная задача была — получить презентационное письмо, в котором будут описаны преимущества сотрудничество с компанией. Запрос подойдет тем, кто если не хочет подбирать формулировки и писать письмо самостоятельно.
Запрос выглядел так: «Напиши презентационное письмо о сотрудничестве для крупной компании от швейной фабрики, которая шьет и брендирует футболки, спортивные костюмы, кепки и сумки шоперы. Фабрика выпускает 5 000 изделий в месяц на качественном оборудовании и материалах. В конце добавь призыв к действию перейти на сайт и рассчитать стоимость продукции».
Вывод. ChatGPT писал ответ очень долго — несколько минут. В некоторых частях письма нейросеть зависала и «думала». Готовое письмо показалось мне «перехваленным» и длинным. Нейросеть додумывала отдельные пункты — например, что на сайте есть «инструмент для расчета стоимости продукции». В уточняющих запросах можно попросить сделать стиль более нейтральным, сократить число символов, скорректировать факты.
YandexGPT написал письмо быстрее, оно уже в первой версии показалось мне более информативным и емким. В нем был более выдержанный стиль и не было додумываний.
Конечно, оба текста придется подкорректировать: у YandexGPT нужно заменить приветствие «Уважаемые представители крупной компании», а у ChatGPT — странный призыв к действию в конце.
Запрос 3: провести ресерч
Мы смоделировали ситуацию, при которой ищем научные статьи на тему пользы магния. Можно использовать, если не хочется лазить по ссылкам и подбирать подходящие источники в научных библиотеках.
Запрос был таким: «Найди 5 исследований о том, что прием магния помогает улучшить память».
Вывод. YandexGPT не смогла найти ответ даже после уточнения запроса — нейросеть еще не умеет делать ресерч. ChatGPT нашел названия, но почему-то решил, что мне нужны только немецкие исследования. Я дополнила запрос и попросила добавить ссылки на источники, но он не смог этого сделать, так как в базе нейросети нет URL-адресов. Когда я решила найти статьи вручную, оказалось, что некоторых попросту не существует. Такие ситуации возникают с ChatGPT регулярно — она может давать информацию из несуществующих источников. Поэтому нейросеть хоть и справилась формально лучше, чем YandexGPT, но ответы не всегда могут быть достоверными.
Запрос 4: контент-план
Мы попросили нейросеть создать контент-план на тему древнегреческой литературы и не давали вводных данных о том, для какого проекта план нужен — кроме темы и количества постов условий не было. Задача подойдет, если идеи для контента уже кончились.
Задача: «Напиши контент-план для соцсетей из 7 постов на тему древнегреческой литературы»
Вывод. ChatGPT дольше писал ответ, но он оказался более полным: кроме общей темы предложил, на чем сделать акцент. Правда, план выглядит крайне линейным, хронологически последовательным и привязанным к авторам — он напоминает план образовательных лекций, а не постов для соцсетей. Возможно, для алгоритмических лент это будет не лучшим решением.
YandexGPT написал ответ быстрее, темы его плана более общие и сгруппированные: он рассматривает не отдельных авторов, как план ChatGPT, а блоки комедии, драмы, мифов. Но при этом не все темы подходят для постов в соцсети. Например, уместить в один пост рассказ об «Одиссее» и «Илиаде» вряд ли получится, а тема “Семь чудес света” не связана напрямую с литературой.
Не все темы можно будет сразу брать в работу: некоторые достаточно абстрактные и их нужно уточнять. Но для того, чтобы набрать свежих идей — вполне подходит.
Запрос 5: упростить официальный юридический язык
Мы попросили упростить приложение из Жилищного кодекса о том, что арендатор может попросить компенсацию, если сделает ремонт или купит мебель в арендованном жилье. Задача подойдет, когда непонятно, что говорится в официальных объявлениях и законах. Чтобы не сломать мозг, можно воспользоваться нейросетями.
Запрос: «Перепиши простыми словами предложение «В случае, когда арендатор произвел за счет собственных средств и с согласия арендодателя улучшения арендованного имущества, не отделимые без вреда для имущества, арендатор имеет право после прекращения договора на возмещение стоимости этих улучшений, если иное не предусмотрено договором аренды». Напиши так, чтобы было понятно 10-летнему ребенку.»
Вывод. YandexGPT и ChatGPT составили длинные предложения сложным языком, почти как в тексте закона. При этом обе нейросети добавили жизненные примеры — стало немного понятнее. Кажется, что нейросети не совсем справляются с такими запросами — немного помогают разобраться, но текст придется переписывать.
Что в итоге
В повседневных задачах задачах мне чаще всего требуется находить проверенные источники, например исследования, переписывать сложно и непонятно написанный текст (такой, как законы) простым языком. На эти задачи часто уходит по несколько часов. К сожалению, с этим обе нейросети пока не могут мне помочь.
Что касается других задач: ChatGPT лучше и подробнее расписывает примеры, приводит реальные жизненные ситуации, когда нужно объяснить что-то теоретическое. YandexGPT лучше пишет деловые письма, так как нейросеть обучали русскоязычные специалисты, а ChatGPT обучался в основном на зарубежных источниках.
Использовать YandexGPT для меня проще, так как для него не нужно менять IP-адрес и подключать иностранный номер. Но назвать нейросеть Яндекса полноценным сервисом пока нельзя.