..

Как я генерировал обложки для выпусков подкаста

Читать в Telegram

На Google I/O 2024 было очень много разговоров про AI, и это напомнило мне о планах по созданию обложек для эпизодов подкаста в каком-нибудь Kandinsky. Был как раз свободный вечер, и решил попробовать сделать изображения для всего Flutter Middle Podcast.

Попробовал несколько решений, вроде везде генерируются +- одинаковые обложки, но каждый сервис имеет свои нюансы. Где-то имеются ограничение на количество картинок, которые можно сделать за сутки. Некоторые сервисы не позволяют делать изображения приватными, или же менять размеры полученного результата. Выбирал не долго, и остановился на Kandinsky 3.1. Оно работает чуть быстрее остальных (точный список сходу не назову), дает тот результат, которых ожидаешь (будто в голову заглядывает и читает мысли), а еще очень сильно зашла возможность работы через бота в Telegram (остаток картинок я вообще генерил на диване перед сном).

Процесс создания изображений упрощен до невозможного (так почти везде), но есть огромный минус - размер готовой картинки. Мой дистрибьютор принимает от 1400x1400 до 3000x3000, в то время как у Kandinsky максимум это 1024x1024. Можно воспользоваться онлайн-скейлерами, но там ограничения на обработку картинок по часам или дням, да и в целом очень долго по одному изображению менять размер.

Со скейлом помогла утилита Upscayl - бесплатно на GitHub’е, в App Store она с ценником, но тут уже на ваше усмотрение. Есть под все платформы. На прошлом месте работы один из наших дизайнеров советовал ее и рассказывал о работе без подключения к сети и скорости скейла, а я почему-то забыл об этом. В итоге 22 изображения были переделаны за 20 минут, с учетом того, что я периодически на что-то отвлекался (уже и забыл, что есть софт, который не реализован в виде веб-приложения. Кроме IDE, само-собой, но может быть кто-то уже и в облаке работает). Единственный нюанс - если не выбирать сжатие, то полученные изображения будут по 18 мегабайт, в то время как площадка дистрибьюции принимает максимум 5. Это нужно учитывать перед массовой генерацией, чтобы не делать одно и то же несколько раз.

Результатом доволен, может быть еще как-то потом отредактирую обложки, но пока кажется, что внешний вид подкаста на площадках преобразился. Если когда-нибудь вам придется взаимодействовать с AI для работы с изображениями, то тулзы выше - это отличный выбор как для начала ознакомления с обработкой картинок, так и хороший помощник в продолжении данного процесса.