Новости 28.03.25 16:34 —

OpenAI добавила в GPT‑4o «продвинутый» генератор изображений

Модель может обрабатывать до 10-20 различных объектов в одном изображении

Генерация изображений в GPT‑4o отличается точной визуализацией текста и выполнением промптов, по словам компании. Модель использует базу знаний и контекст из чата — картинки и текст. Например, при генерации персонажа для видеоигры его внешний вид будет оставаться неизменным, сколько бы правок не внёс пользователь.

Модель может обрабатывать до 10-20 различных объектов в одном изображении. Кроме того, она анализирует загруженные пользователем картинки и учитывает их в будущем. Теперь генерация занимает больше времени, порой — до минуты.

OpenAI отметила, что модель не всегда работает идеально. Например, иногда она может обрезать вытянутые изображения, некорректно визуализировать что-то, если картинка предполагает большое количество объектов (например, таблицу Менделеева), или галлюцинировать при использовании не латинских букв.

Генерация изображений 4o будет доступна в Sora, а также всем пользователям ChatGPT, в том числе бесплатным.

OpenAI выпустила семейство моделей для создания голосовых помощников →

Технология получила поддержку русского языка

Источник: vc.ru

Правила сообщества

будьте вежливы, уважайте участников;
старайтесь оставлять информативные, полезные и интересные комментарии;
соблюдайте действующее законодательство;
мы не приветствуем размещение промокодов и рекламы;
вы тоже можете стать автором или участником проекта и продвигать свои промокоды;