YouTube остается одной из самых сильных площадок для продвижения и контента, а нейросети уже реально меняют то, как этот контент создается. Сегодня ролик можно создать полностью с помощью ИИ — от сценария до монтажа. И такие каналы уже собирают сотни тысяч подписчиков.
В этом интервью мы поговорим с автором YouTube-канала «Свиток Истории» Артемом Логоней. Он создал канал 4 апреля, и за это время набрал более 100 тысяч подписчиков.
Артем опубликовал за пять месяцев всего лишь 65 роликов (из них 15 видео ушло на достижения лимита монетизации) и заработал более $3500. Он создает контент при помощи нейросетей, но делает это качественно.
— Ты всегда работал с YouTube? Давно занимаешься созданием контента?
— На самом деле это мой первый опыт. Раньше я занимался арбитражем на Дзене, но примерно год назад там начались проблемы, и стало сложно фармить каналы. Я какое-то время пытался работать в старой схеме, а потом решил попробовать новое направление — выбор пал на YouTube/ Тема нейросетей зацепила меня случайно: я просто был подписан на разных контент-мейкеров, которые работали с ИИ. Но опыт в монтаже у меня был — помимо арбитража я занимался серой монетой: монтировал и перерабатывал ролики с YouTube и заливал их на Дзен.
— Артем, расскажи, как именно ты построил процесс создания видео: какие нейросети используешь и за что каждая отвечает?
— У меня весь цикл завязан на нейросетях. Начинаю всегда со сценария: короткий хук, динамичное повествование и финал — все это прогоняю через ChatGPT. Потом подключаю Sora для картинок, она хорошо понимает контекст и даже может отрисовать исторические сцены с нужной атмосферой. Озвучку делаю через ElevenLabs — там беру готовый голос и разбиваю текст на части, чтобы звучало естественнее. Дальше анимирую часть изображений: для эффектных кадров использую Higgsfield, для более простых движений — Hailuo AI. В финале все собираю в CapCut: склейка, музыка, субтитры, немного динамики на статичных картинках. В итоге получается готовый ролик, который уже можно заливать в Shorts.
— На что уходит больше всего времени? Какой элемент видео ты считаешь самым важным?
— Больше всего времени у меня уходит на сценарий. Я начинаю с идеи, потом выжимаю хук на 1–2 предложения для первых 5–8 секунд, собираю плотное повествование без воды и финал, который закрывает хук. И уже прогоняю его через ChatGPT. Иногда могу доверить нейросети сценарий, но его все равно приходится править. Дальше режу текст до 40–60 секунд, прогоняю по таймингу (hronomer.ru) и еще раз вычищаю — целюсь в удержание 70%+. Без этого Shorts просто не летят.
Самый важный элемент — опять же сценарий. Нейросети помогут с картинками, озвучкой и анимацией, трендовые эффекты дают кратковременный хайп, но стабильные просмотры и монетизация приходят только там, где история цепляет и держит до финала. Все остальное — усилители, но они не заменят идею и структуру.
— А откуда ты берешь идеи для видео?
— Я работаю над идеей в два шага: сначала выбираю тематику, потом копаю источники. По тематике у меня базово «история России/СССР» — это вечнозеленая ниша с лояльной аудиторией. Лучше всего заходят герои и подвиги ВОВ, «сталинская эпоха», Афган, криминал и вооружение СССР. Плюс я добавляю современную историю 90-х и 00-х — ее мало кто трогает, а там куча цепких сюжетов. Всемирная история тоже работает, но там выбираю только самые «вау»-факты, чтобы они были интересны русскоязычной аудитории и без политподтекста (иначе партнерка не пропустит).
По источникам для идей могут выделить три главных: YouTube Shorts, длинные ролики на YouTube и статьи на Дзене. В Shorts смотрю, что залетало, и проверяю заезженность темы поиском. Если за год по одному сюжету было 3–5 вирусных шортсов, думаю, смогу ли я переупаковать: написать сильнее хук и финал, добавить факты и сделать ярче визуал. Часто беру среднепопулярные сюжеты и делаю их лучше. В длинных видео выгружаю субтитры, выжимаю «мякотку» в короткий текст и превращаю в сценарий на 40–60 секунд. Со статьями на Дзене — тот же принцип: сжатие, переупаковка, плюс добавляю новые детали для уникальности. Копировать «1 в 1» нельзя — всегда докручиваю.
Важный момент: идею я вообще не беру, если не вижу пары «Хук → Финал» сразу. На этапе поиска я уже прикидываю, чем зацеплю в первые 5–8 секунд и чем закрою обещание в конце. Если хук слабый или развязка никакая — вычеркиваю без жалости. Обычно держу простое правило: каждую неделю находить 5 идей и для каждой сразу записывать хук и финал — это сильно экономит время на продакшене.
— А как у тебя получается создавать такой сочный визуал?
— Визуал собираю после сценария и всегда начинаю с визуального хука. Считаю неправильным сначала озвучивать, а потом рисовать — во время генерации картинок часто приходят идеи, как усилить или ужать текст.
90% изображений делаю в Sora, а промпты готовлю через GPT. Но это не автопилот: примерно 40–50% промптов я правлю или выкидываю, иначе получается «пластик». Смысл — качать собственный вкус и стиль, потому что именно он отличает канал среди сотен ИИ-авторов.
Сначала придумываю обложку-хук: гипертрофированную, эпичную, иногда абсурдную — задача пробить «баннерную слепоту» в ленте Shorts. Чтобы разогреть фантазию, прошу GPT выдать 20 идей обложек по моему сценарию, скрещиваю лучшие и уже под это формирую точный промпт.
Для промптов у меня есть жесткий шаблон: фотореализм, в начале — короткий контекст (год/место/событие), без слов про насилие/кровь, источник света всегда указан, в кадре не больше трех людей, каждое описание самодостаточное. Если герой повторяется, фиксирую внешность трюком «похож на актера X» — так Sora держит одно лицо от кадра к кадру.
Дальше генерю весь визуальный ряд: завожу новый чат, даю GPT сценарий и правила к промптам, иду по строке сценария → 2–3 варианта промптов на строку. В Sora делаю с запасом, внимательно отбираю, правлю слабые места. Ориентир: 1 строка сценария = минимум 1 картинка (а если кадр статичный — беру 2–3, чтобы было чем «дышать» на монтаже).
— А что с озвучкой? Ты всегда используешь ИИ для этого?
— Да, для озвучки я всегда использую ИИ, конкретно сервис ElevenLabs.Я выбираю русский голос в библиотеке и обязательно ставлю модель High Quality — там больше настроек. Озвучиваю частями по 2–3 предложения, чтобы легче было отлавливать «артефакты» и не переписывать длинные куски. Если где-то сбивается ударение — просто ставлю ударную букву вручную и все читается правильно.
Когда весь текст озвучен, собираю аудио в Audacity: вырезаю лишние паузы и довожу запись до идеала. Здесь мелочей быть не должно — плохая дикция или косяки с ударениями сильно бьют по удержанию, поэтому я всегда стараюсь, чтобы звук был максимально чистым.
— У тебя в роликах используются как просто изображений, так и врезки видео. Причем именно видео у тебя меньше чем фото. Почему?
— Видео-врезок у меня меньше, чем фото, по трем причинам. Во-первых, прагматика продакшена: для Shorts не нужно «оживлять» все подряд. Я всегда анимирую только визуальный хук и 1–2 акцентных кадра, а остальную динамику добираю на монтаже в CapCut (зум, панорамы, плавные переходы). Так ролик выглядит живо, но сборка идет быстрее и стабильнее.
Во-вторых, ограничения самих ИИ-сервисов. Аниматоры типа HailuoAI или Higgsfield дают ограниченные бесплатные генерации и часто замедляются в часы пика. Где-то первые запросы «летят», а дальше начинается очередь; у других вообще по паре рендеров в месяц на аккаунт. Если пытаться делать много полноценных видео-вставок, продакшн превращается в управление аккаунтами и ожиданиями, вместо того чтобы выпускать ролики.
И в-третьих, качество и контроль. Даже лучшие модели иногда выдают «странные» движения. С фотографиями из Sora я держу стиль и лицо героя, а на таймлайне добавляю ровно столько движения, сколько нужно. Итог: больше фоторяд + точечные видео-врезки = выше скорость, меньше артефактов, стабильнее удержание.
— В Telegram-канале ты пишешь, что расходы — ~500 ₽/мес. На что именно уходят деньги?
— На самом деле затраты тут минимальные. У меня основные расходы — это чисто «мелочевка», без которой работать все равно не получится. Это временные гугл-почты для абуза нейронок, прокси, иногда копейки на дешевые подписки/расходники. В сумме выходит 300–500 рублей в месяц. Я не плачу по $120 за западные сервисы, не держу команду и не покупаю каналы — весь контент делается через бесплатные лимиты нейросетей и обходные схемы.
— Сколько времени уходит на создание одного видео?
— В среднем на один ролик уходит около 4–5 часов. Это если делать все по алгоритму: сценарий, генерация картинок, озвучка, анимация и монтаж. На старте процесс может растягиваться дольше, потому что приходится учиться и разбираться в инструментах. Но со временем все автоматизируется, многие этапы делаются быстрее, и реально уложиться в полдня. Именно поэтому при стабильной работе по одному ролику в день уже можно выходить на хороший месячный профит.
— Когда есть смысл масштабировать на 2–3 канала и как организуешь работу?
— Масштабироваться на 2–3 канала есть смысл только тогда, когда один канал уже уверенно приносит просмотры и держит стабильный RPM. То есть ты уже набил руку, у тебя выстроен алгоритм: сценарий пишется быстро, картинки и озвучка делаются без затыков, ролики стабильно залетают в рекомендации. Если этого нет, то распыляться на несколько каналов бессмысленно — просто потеряешь фокус и время.
Обычно схема такая:
- Первый канал — учеба и обкатка процессов. Тут ты разбираешься с нейронками, отлаживаешь сценарии и визуал, проверяешь, какие темы лучше заходят.
- Второй канал — копируешь алгоритм, но меняешь тематику или стиль, чтобы охватить другую аудиторию. Часто это историческая ниша + общая история или, например, СССР + мировые войны.
- Третий канал — можно отдать в работу помощнику. То есть ты пишешь сценарии или даешь ТЗ, а остальное (генерация картинок, озвучка, монтаж) делает человек по инструкции.
Так появляется «пул каналов», которые друг друга бустят: новые ролики подталкивают старые, а регулярность публикаций растет.
— Что отличает просто хороший ролик от ‘выстрела’ на 5–10+ млн? На каком этапе чаще всего рождается этот буст?
— Хороший ролик — это когда у тебя аккуратный визуал, понятный текст и нормальное удержание (60–70%). Такие ролики дают 200k–500k просмотров и приносят стабильный RPM.
«Выстрел» — это когда зрителя цепляет уже с первой секунды (сильный хук, шокирующее или интригующее утверждение, вопрос), и он не отлипает до конца. Удержание 75%+ и высокий CTR (кликабельность обложки) запускают цепную реакцию: YouTube начинает активно докидывать показы в рекомендации.
Буст чаще всего рождается на этапе сценария — именно там закладывается интрига, темп и финал, который оправдывает ожидание. Второй критичный момент — визуальный хук и обложка: они решают, даст ли алгоритм ролику шанс. Все остальное (озвучка, монтаж, анимации) — уже поддержка, они влияют на то, удержится ли зритель, но не запускают рост сами по себе.
Короче, «выстрел» — это всегда комбинация: мощный хук + визуал, который пробивает баннерную слепоту, и финал, ради которого человек досмотрел. А потом алгоритм сам начинает разгонять.
— Планируешь переходить из Shorts в лонги? Чем отличается подход и какая экономика в бурж-сегменте?
— Да, в лонги я планирую идти — но это уже некст левел. Подход отличается в первую очередь по глубине: если в шортсе тебе надо удержать 40–60 секунд и работать только хук → динамика → финал, то в длинных видео важно держать внимание несколько минут подряд, без провисаний. Тут нужен более плотный сценарий, раскадровка, ритм — иначе зритель отвалится на 2–3-й минуте.
По экономике разница колоссальная. В бурж-сегменте (США, Канада, UK и т. д.) шортсы дают в среднем $35–40 за миллион просмотров, а вот у длинных роликов доходность уже другая: там идет RPM в $4–5 за каждую тысячу просмотров. В пересчете это может быть десятки тысяч долларов за один залетевший видос.
Пример: есть канал, где видео на 8 минут собрало просмотров и принесло $43k только на монете. И это без сторонних интеграций и арбитража.
По сути, схема простая: начинаешь с шортсов, прокачиваешь руку, учишься делать сценарии и визуал. А когда понимаешь механику и уже собрал базу подписчиков, можно прыгать в лонги. Там выше конкуренция, выше требования к качеству, но и экономика x10 по сравнению с шортсами.
— Какие планы на ближайший год? Хочешь развивать новые форматы, выходить на другие языки или добивать миллион подписчиков?
— План простой: держать регулярность и не сбавлять темп. YouTube — это про дисциплину, и я вижу, как с каждым месяцем ролики не только стабильно приносят просмотры, но и тянут старый пул наверх. В ближайший год хочу протестировать несколько направлений: выйти в бурж-сегмент, попробовать делать не только шортсы, но и лонги — там экономика совсем другая. Миллион подписчиков? Это вопрос времени, а не «если». Ну и параллельно — обкатка новых нейронок: они сейчас каждый месяц выстреливают, и важно успеть встроить их в процесс, пока конкуренты еще спят.
— Какие советы дашь тем, кто только думает зайти в тему? — три главных правила, чтобы не слиться.
— План простой: держать регулярность и не сбавлять темп. YouTube — это про дисциплину, и я вижу, как с каждым месяцем ролики не только стабильно приносят просмотры, но и тянут старый пул наверх. В ближайший год хочу протестировать несколько направлений: выйти в бурж-сегмент, попробовать делать не только шортсы, но и лонги — там экономика совсем другая. Миллион подписчиков? Это вопрос времени, а не «если». Ну и параллельно — обкатка новых нейронок: они сейчас каждый месяц выстреливают, и важно успеть встроить их в процесс, пока конкуренты еще спят.
![]()

















привет, подскажи свои контакты, хотел бы пообщаться по сценариям, да и вообще пернять не много пыта, если такая возможность может существовать?