9 AI-сервисов для генерации текста и картинок
Привет! С вами Иван, технический специалист в нейроредакции ПромоСтраниц. Одна из моих задач в команде — находить и тестировать AI-сервисы, чтобы редакторы потом могли применять их в своих задачах.
За год работы удалось собрать личный топ нейросетей, которые помогают создавать текстовый и визуальный контент. В этом подробном уроке-гайде расскажу про каждый инструмент детальнее, разберу плюсы, минусы и подводные камни
Но для начала несколько дисклеймеров.
- Я перечислю лишь девять нейросетей, которые облегчат жизнь автору, редактору и маркетологу. Инструментов гораздо больше — когда начнете плотно работать с AI, наверняка найдете что-то еще, что поможет в работе.
- В моем уроке не будет каких-то лайфхаков, инструкций и промптов — только краткий обзор базовых инструментов. Все правила получите в следующих уроках, они так или иначе будут работать во всех нейросетях из моего списка.
- Чтобы вам было проще изучить плюсы и минусы всех инструментов, разделю на три группы: универсальные, текстовые и графические.
- Информация по нейросетям, их возможностям и доступам актуальна на апрель 2024 года.
- Часть нейросетей официально недоступна в России — какие именно, буду рассказывать в самих обзорах. Но думаю, вы и без меня знаете, как получить к ним доступ 😉
А теперь к нейросетям 👇🏼
Универсальные нейросети для создания текста и картинок
ChatGPT
Настоящая нейросеть маминой подруги. Именно на ChatGPT (точнее чат-боте на основе нейросети GPT) начала работать нейроредакция и в целом во многом благодаря ему начался такой AI-хайп. А еще сейчас это самая продвинутая нейросеть, которая отлично справляется как с изображениями, так и с текстами.
Как начать работать. Официально ChatGPT недоступен в России, но можно попасть на сайт обходными путями — например, подключиться к Telegram-ботам или установить расширение для Google Chrome.
Подробно останавливаться на этих и других способах не буду — в интернете много статей, как получить доступ к нейросети из России. Если все получилось, заходите на сайт.
Какие есть особенности. В ChatGPT две версии: GPT 3.5 и GPT 4. Бесплатно и без регистрации доступна первая — в целом ее достаточно, чтобы начать знакомство с этим инструментом. Можете вводить разные промпты — нейросеть прекрасно понимает русский язык, дружелюбна и сделает все возможное, чтобы помочь решить вашу задачу.
GPT 4 — более продвинутая версия, правда доступ к ней стоит 20 долларов ежемесячно. Так что если захотите ее попробовать, нужны будут сим-карта иностранная банковская карта. Зато качество ответов у четвертой версии лучше, чем у третьей, плюс открывается доступ к разным фишкам, которые упрощают работу.
Для примера — вот результаты двух версий, которые мы попросили написать текст о SMM. Угадайте, где какая.
Спойлер: ChatGPT 4 на первом скрине
Другие плюсы и минусы
➕ Возможность работы на русском языке. Нейросеть прекрасно его понимает, хотя отвечает чуть медленнее, чем на английском. А еще ChatGPT любит делать кальку с английского — например, отвечать на ваш вопрос «абсолютно!».
➕ Огромные возможности для любого типа задач. С помощью ChatGPT мы пишем полноценные статьи, анализируем статистику, устраиваем брейнштормы, генерируем идеи для картинок и так далее.
➕ Аккаунт легко донастроить для удобной работы. OpenAI постоянно внедряют крутые штуки. Например, к четвертой версии ChatGPT можно подключить дополнения, которые умеют читать ссылки, делают саммари видео, подбирают картинки и генерируют их и так далее.
Можно загружать файлы — например, показать нейронке бриф или пример статьи. Есть режим Custom Instructions — если используете аккаунт ChatGPT 4 только для написания рекламных статей, можно загрузить туда основные правила работы, чтобы не повторяться из чата в чат.
Вот такие настройки у нашего аккаунта. Можете скопировать и протестировать.
➖ Статью в любом случае придется «допиливать». Как и любая нейросеть, ChatGPT 4 грешит каким-то странными формулировками, водой, фактическими ошибками — а еще лепит опечатки, делает кальку с английского языка и использует штампы. Поэтому тексты от ChatGPT 4 нужно дорабатывать — причем можно просить это сделать саму нейронку, она прекрасно понимает, что такое «вода» и «абстракции».
Copilot / Бывший Bing AI
Нейросеть от Microsoft, которая работает на языковой модели GPT-4. То есть ответы он выдает как ChatGPT 4. При этом (что круто) доступ к нему бесплатный. А еще в нем можно генерировать изображения (тоже бесплатно).
Как начать работать. Copilot официально не доступен в России. Еще понадобится браузер Microsoft Edge (бывший Internet Explorer) — именно там работает нейросеть. Запускаете браузер, переходите в поисковую систему Bing, авторизуетесь и в правом углу поисковой строки нажимаете на логотип Copilot.
Какие есть особенности. Строго говоря, Copilot не совсем нейросеть — скорее бесплатный виртуальный помощник (именно так его называет Microsoft) на основе AI с доступом к интернету.
Основная его задача — помогать пользователю в решении бытовых вопросов. Например, составить маршрут для отпуска или придумать рецепт на ужин. В написании текста он тоже может пригодиться, но вот полноценную статью в один заход написать сложно — Copilot быстро теряет контекст, ему приходится напоминать о задаче и вводных.
Другие плюсы и минусы
➕ ИИ-сервис, очень похожий на ChatGPT4. Основное — возможность получать ответы из интернета и генерировать текст и изображения — доступно бесплатно. Платная версия у Copilot тоже есть — стоит 20 долларов. Мы в редакции не пробовали, но судя по описанию платная версия работает быстрее, а еще пользователям открываются разные дополнения (почти как у ChatGPT 4).
➕ Несколько несколько стилей беседы. На выбор есть творческий, сбалансированный и точный режимы, легко настраиваются одной кнопкой Отличаются стилем ответа:
- в точном — дает краткие ответы, подкрепленные фактами и ссылками;
- в творческом — генерирует оригинальный текст;
- в сбалансированном — соблюдает баланс между первым и вторым стилями.
По опыту, писать статью лучше в творческом режиме — в нем нейросеть словно начинает думать как копирайтер. В других стилях выдает что-то странное — ниже как раз пример сбалансированной беседы.
➕ Можно подключить дополнения-помощники. Бесплатно доступны генерация изображений, составление меню на ужин и маршрута на отпуск, фитнес-тренер. Остальное платное, но, кажется, самое главное (текст и картинки) есть и ладно.
➖ Очень капризный и вредный. Copilot быстро теряет контекст — буквально 1–2 запроса и все, нужно напоминать о вводных. Если ему выдавать много информации за раз, забывает бо́льшую часть. А еще ему вообще нельзя говорить, что он в чем-то неправ. Иначе получится то, что на скрине.
Нейросети для генерации текста
YandexGPT 2
Стремительно развивающаяся нейросеть от Яндекса. Подойдет тем, кто хочет познакомиться с AI-миром, но не знает как и с чего начать. Основной плюс: YandexGPT 2 бесплатный, никакой головной боли с оплатой и обходными маневрами. При этом нейросеть быстро и стабильно работает, что выгодно отличает ее от иностранных аналогов.
Именно на YandexGPT 2 мы и будем показывать все правила работы с нейросетью, а вы — делать домашние задания и итоговые проекты.
Как начать работать. Здесь вообще все максимально просто — открываете страницу поиска Яндекса, в правом нижнем углу нажимаете на иконку «Алисы» и выбираете навык «Давай придумаем». Появится окно, в котором по умолчанию активен YandexGPT 2 — вот и всё, можно начинать работать.
Еще YandexGPT 2 доступен в Яндекс Браузере и устройствах с Алисой (например, на Яндекс Станциях).
Другие плюсы и минусы.
➕ Есть возможность принять участие в бета-тестировании. По опыту, YandexGPT 2 в этой версии отвечает получше, плюс здесь появились чаты — можно разделять задачи на разные диалоги.
➕ Неплохо работает с короткими запросами. Нейросеть может легко составить план статьи, придумать хорошие заголовки, написать лид-абзац и CTA, подобрать сценарий. Еще как-то скидывали ей подборку из гаджетов и просили разбить по критериям, которые она должна была подобрать сама, — справилась.
➕ По сравнению с иностранными нейросетями стиль более простой и человеческий. Конечно, YandexGPT 2 не чужды водянистые и абстрактные формулировки (как и любой другой нейронке), но ее речь все-таки более живая и понятная. Возможно, дело в том, что она анализирует задачу на русском языке и выдает ответы также на русском.
➖ YandexGPT 2 очень осторожная. Вместо тысячи слов — один скрин.
Такая особенность очень мешает хорошо выполнить задачу, приходится переформулировать мысли и подбирать промпты. Кстати, на одном из вебинаров школы AI-редакторов Даша Журавлева поделится способами «хакнуть» YandexGPT и расскажет, что делать, если нейросеть отказывается хорошо работать.
Gemini / Бывший Bard
Еще одна бесплатная нейросеть, с которой точно стоит поэкспериментировать. Gemini хорошо дружит с русским языком и в целом может помочь автору, редактору и маркетологу в его работе. Скорость работы хорошая, как и ответы системы на промты пользователей.
Как начать работать. Официально Gemini в России не поддерживается. Чтобы получить доступ, нужно авторизоваться через Google-аккаунт, затем можно приступать к работе. Волшебных настроек тут нет, обычный чат, в котором можно писать что угодно и пробовать решать свои задачи.
Другие плюсы и минусы.
➕ Любит помогать сверх меры (в хорошем смысле). После ответа на ваш промпт Gemini постарается еще больше угодить и предложит дополнительную информацию. Например, если попросить его сделать десят заголовков, он добавит еще парочку. Другой пример — попросил его помочь написать урок по 8 ИИ-сервисам, а он докинул советы по работе с нейросетями.
➕ Можно загружать фотографии. Людей воспринимать отказывается, но вот другие изображения (например, животных) описывает достаточно неплохо.
➖ Галлюцинирует (и даже не стесняется). К примеру, здесь попросили Gemini проанализировать текст на скриншоте, а он начал выдумывать про женщину и мужчину 🤷🏼
Claude 3
Claude 3 — чат-бот Anthropic AI, компании, основанной бывшими сотрудниками OpenAI. Нейросеть не такая известная, как тот же ChatGPT, но очень крутая. Генерирует ответы хорошего качества, есть платная и бесплатная версии. При этом у нейросети есть и слабые места, но обо всем по порядку.
Как начать работать. Claude тоже не доступен в России. Еще одна проблема — чтобы зарегистрировать аккаунт, нужна sim-карта. Любая не подойдет, только определенных стран (точно можно США). Если все получилось, увидите вот такое окно.
Другие плюсы и минусы
➕ Самое главное — стилистика ответа. Если тот же ChatGPT 4 грешит калькой с английского и водянистыми конструкциями, Claude пишет текст более человеческим языком, приближенным к русскому, — примерно на уровне с Yandex GPT 2. Для примера — вот результаты ChatGPT 4 и Claude на один и тот же запрос.
➕ Можно загружать файлы. Тут по аналогии с ChatGPT 4 — Claude умеет читать и анализировать pdf, txt, html, doc, pptx и многие другие форматы. Правда, xls он не поддерживает, так что таблицы загрузить не получится. Но в любом случае фишка очень полезная и крутая — а с учетом, что аналогичная опция доступна в ChatGPT только в платной версии, вообще ценная.
➖ Есть лимит на запросы. Причем он довольно странный — как такового количества запросов в единицу времени нет. Лимиты зависят от того, какого объема текст загружаешь в Claude и как часто отправляешь запросы. Лимит на запросы в платной версии в пять раз больше, но получить к ней доступ не так просто — иностранная карта тоже не любая подходит.
Нейросети для генерации изображений
YandexART
По аналогии с YandexGPT 2, YandexART — идеальный вариант, чтобы начать знакомство с нейросетями для изображений. Это классный базовый и бесплатный инструмент. Не нужны танцы с бубном, чтобы получить доступ, а изображения получаются относительно детализированными и реалистичными.
Как начать работать. Просто скачиваете на смартфон бесплатное приложение Шедеврум (именно в нем работает YandexArt) и заходите под своей яндексовой почтой. Десктопная версия Шедеврума есть только у MacOS. Владельцам Windows придется либо скачать приложение на смартфон, либо установить эмулятор Android на ПК (по типу Nox Player).
На самом сайте Шедеврума генерировать ничего нельзя, только смотреть уже готовые работы пользователей.
Другие плюсы и минусы
➕ Умеет генерировать практически все. Опытным путем выявили, что лучше всего у него выходят люди и животные, пейзажи, интерьеры и автомобили. Иногда получаются бытовая техника и электроника, круче всего генерирует смартфоны.
➕ Понимает русский язык. На английском тоже генерирует, но как будто по-другому — к примеру, люди сильно отличаются. Возможно, дело в том, что Yandex Art обучали на российских данных — кстати, как раз поэтому она знает, кто такие Чебурашка, богатыри и Баба-яга.
➕ YandexArt постоянно развивается. Само приложение Шедеврум появилось в апреле 2023 года и с тех пор только улучшается. Раньше для создания реалистичного изображения приходилось долго подбирать промпт и повторно генерировать картинки, а сейчас все работает с первого раза.
Пример: на первом фото в галерее смартфон из апреля 2024 года, на втором — из ноября 2023 года, на третьем — из июля 2023 года
➖ Бывают промахи. Стандартно — лишние или недостающие пальцы со сросшимися ногтями, поплывшие глаза, странные улыбки. Еще есть проблемы с буквами и надписями. А иногда YandexART генерирует вообще не то, о чем его попросили. Но это все решается подбором промптов — об этом подробнее расскажет Элина Крючкова в своем уроке на третьей неделе школы.
Krea
Krea — относительно молодая нейросеть: альфа-версию запустили летом 2023 года, в 2024 году бета стала доступна всем желающим (в том числе и в России). Основная фишка инструмента — два режима: генерация в режиме реального времени (Real-time Generation) и улучшение (Upscale & Enhance). Чуть дальше расскажу подробнее про каждый.
Как начать работать. Переходим по ссылке, попадаем на главную страницу сервиса и регистрируемся (можно через гугл-аккаунт).
Другие плюсы и минусы
➕ Режим Real-time Generation — режим генерации в реальном времени. Удобен тем, что вы можете сгенерировать картинку, сразу понять, что хотите в ней улучшить, и внести изменения, не генерируя все заново.
В Real-time Generation экран (холст) разделен на три части:
📌 Доска для рисования, по сути аналог Paint, на которой можно отрисовывать какие-то детали.
📌 Место для сгенерированного изображения. Оно меняется в реальном времени в зависимости от того, что вы делаете: переписываете промпт, отрисовываете что-то на доске или применяете стиль.
📌 Окно для написания промта на английском языке и вертикальный бегунок, с которым вы можете менять степень отклонения отклонения от промпта.
Допустим, вы хотите сгенерировать красный чайник на кухонном столе. Вводите промпт red kettle on the kitchen table. Далее меняете стиль изображения, степень отклонения от промта и дорисовываете что-то на доске — например, красный кружочек слева.
Ваша картинка меняется в режиме реального времени, причем результат может показаться не слишком качественным. Но достаточно нажать кнопку Quick Enhance в меню справа — за пару секунд Krea многократно улучшит изображение.
А вот итоговый результат.
➕ Режим Upscale & Enhance — здесь нейросеть меняет стиль и улучшает изображение. Речь идет не о простой обработке, улучшении детализации, сглаживанию и маскировке каких-то элементов. Krea умеет менять стиль изображения, делать реальными мультяшных персонажей, дорисовывать элементы, подходящие к иллюстрации и многое другое.
Сам режим пригодится, если у вас есть фото продукта в плохом качестве и вам нужно его повысить. Или вы хотите сделать нейрокартинку более реалистичной.
В режиме Upscale & Enhance можно работать как со сгенерированной в самом Krea картинкой (для этого есть окно для написания промта), так и с загруженной фотографией.
Допустим, мы хотим улучшить уже готовую картинку. Загружаем изображение — после загрузки Krea автоматически попробует сгенерировать промт вашего изображения (окно Promt). Затем выставляем стиль из четырех вариантов (например, Product) и пробуем улучшить картинку.
И вот что получилось: слева исходное изображение, справа уже улучшенное.
➖ Krea бесплатный, но только для галочки. В день дается три минуты генерации изображения в реальном времени, а также действует «живая очередь» на улучшение изображений. На несколько картинок хватит и бесплатного доступа, но для нормальной работы этого мало — придется оформить подписку по одному из тарифов.
ImageFX
Еще одна молодая нейросеть для генерации изображений, на этот раз от Google. Правда доступна только в США. Интерфейс очень простой, нейросеть работает бесплатно, а качество и реалистичность не хуже, чем у Midjourney (о нем расскажу дальше).
Как начать работать. ImageFX доступен всем пользователя совершенно бесплатно (возможно, пока). Нужно перейти по ссылке и авторизоваться через гугл-аккаунт.
Главная страница ImageFX. Нет никаких лишних настроек, всё довольно скромно и понятно (ошибиться нереально). Слева находится окно для ввода промпта (только на английском языке). Справа появится результат.
➕ Есть подсказки для промптов. Это главное отличие нейрости от любых других — ImageFX помогает как подобрать слова для вашего промпта, так и подкидывает новые идеи. Например, если попросите нейросеть сгенерировать photo of woman, в выпадающем списке можно заменить первое слово на какой-то синоним. А снизу находятся популярные ключевые слова, которые можно добавить к запросу.
➕ Картинки получаются очень крутыми. Для примера, вот две генерации для промпта cat in dress. Но в целом ImageFX здорово справляется с практически всем. Люди получаются как настоящие, животные — максимально милыми, а бытовая техника, интерьеры и пейзажи тоже на высоте.
➖ Непонятные алгоритмы. Просто woman сгенерировать не получится, а photo of woman — да. То есть нужно прямо подбирать промпты — и то не факт, что удастся. Например, детей вообще никак не получится сделать — слова kids и child не пропускает. Либо это должен быть очень специфический запрос, но мы такой так и не смогли подобрать.
Midjourney
Напоследок про одну из самых популярных нейросетей, которая в ответе за большинство разговоров, что все дизайнеры в скором времени останутся без работы. Конечно, это просто разговоры, но и не на пустом месте: продвинутые пользователи данного сервиса способны создавать уникальные и очень реалистичные изображения.
Как начать работать. Сейчас Midjourney можно пользоваться через Discord. Переходите по ссылке, нажимаете кнопку «Join the Beta», регистрируетсь и присоединяетесь к боту Midjourney. Там как раз можно генерировать изображения. А в личном кабинете можно просматривать историю. Хотя команда уже разрабатывает в нем возможности для генерации изображений.
Другие плюсы и минусы
➕ Midjourney создает реалистичные картинки. Издалека можно даже и не понять, что иллюстрацию сгенерировала нейросеть. Если фотореализм не нужен, это тоже не проблема — создать можно и комиксы, стикеры, фоны для презентаций и много чего другого.
➕ Расширенные возможности для работы с нейросетью. Midjourney можно полностью настроить под свои задачи. Например, в промпте сразу указать размер изображения. А в меню нейросети выбрать, насколько сильно четыре сгенерированные картинки будут отличаться друг от друга.
➕ Можно доработать уже полученное изображение. Функция выручает, когда основная композиция картинки удалась, но отдельные элементы было бы здорово заменить. Для этого достаточно воспользоваться опцией Vary (Region), и происходит магия. Вот, например, заменили розу в лапах милого котенка на весенний тюльпан.
➖ Чтобы создать качественную картинку в Midjourney, придется поработать над промптом. Во-первых, система хорошо распознаёт промты только на английском языке. Во-вторых, здесь обычной прямой речи (как в том же YandexART) может быть недостаточно, хотя результат все равно будет впечатляющий. Для фотореализма нужно прописать настройки камеры, детали внешности человека, выстроить настройки света — в общем, вжиться в роль фотографа.
Так что рекомендую изучить специальные команды для Midjourney (таких много в интернете), которые помогут вам добиться невероятных результатов.
➖ Midjourney — платный сервис. Да, в этом нет ничего плохого, но порой хочется протестировать инструмент бесплатно и понять для себя, нужен он тебе или нет. А так цена за доступ к Midjourney — от $10 до $120 зависит от количества часов работы в быстром режиме. Для оплаты нужна иностранная карта.
Подводим итоги
Как я уже говорил в начале, AI-сервисов очень много. И как видно, у каждого свои плюсы и минусы. Нет единого волшебного инструмента, который сможет выполнить абсолютно все ваши задачи.
Залог успеха — умение работать в разных и не бояться испытывать новые. А еще любой AI-сервис — это в первую очередь просто инструмент, какие бы чудеса он не сотворял. Человек остается главной действующей фигурой во всём продакшене. Поэтому все уроки нашей школы и посвящены тому, как эффективно взаимодействовать с нейросетями.