🎠 CarrosselAI Skill

Engine completo de produção de carrosseis Instagram com IA. Da pesquisa à entrega: pesquisa de fonte, roteiro, capas, imagens, render e upload — tudo executado pelo seu agente OpenClaw, sem configuração extra.

Agente Único Nano Banana Pro (Imagen 3) Render Puppeteer Google Drive (opcional) Telegram / WhatsApp

~8min

Do brief à entrega

Tipos de capa

Tipos de slide

~R$2

Custo por carrossel

💡 O que é o CarrosselAI?

Você digita um tema ou cola o link de uma notícia. O assistente pesquisa, escreve o roteiro, gera as imagens, monta os slides e envia tudo pronto para o seu Telegram ou WhatsApp — em menos de 10 minutos, sem você precisar abrir Canva, Photoshop ou qualquer outro programa.

🗣️

Você fala o tema

"Quero um carrossel sobre Bitcoin e inflação"

🤖

A IA faz tudo

Pesquisa, escreve, gera imagens, monta slides

📲

Você recebe pronto

Slides PNG + legendas no seu Telegram

👥 Para quem é

Maria | Finanças Pessoais
Quer postar conteúdo de qualidade sem passar horas no Canva.

Rafael | Investimentos
Criador que quer escalar produção de 2 para 15 posts/mês.

Ana | Negócios Digitais
Empreendedora que quer presença no Instagram sem contratar designer.

Lucas | Marketing & IA
Agência que quer automatizar produção de conteúdo para múltiplos clientes.

📦 Instalação

Instalar via ClawHub

No terminal do seu OpenClaw: clawhub install carrossel-ai

Ou clonar o repositório

git clone https://github.com/openclaw-skills/carrossel-ai
cp -r carrossel-ai ~/.openclaw/workspace/skills/carrossel-ai

Instalar dependências de render

cd ~/.openclaw/workspace
npm install puppeteer
# Puppeteer fará download do Chromium automaticamente

Responder o questionário de configuração

Na primeira vez que chamar o skill, o assistente faz as perguntas da seção abaixo e salva tudo automaticamente. Pode refazer a qualquer momento com /carrossel-setup.

⚙️ Questionário de Configuração

O assistente faz estas perguntas uma a uma na primeira execução. Leva menos de 3 minutos. Todas as respostas ficam salvas em config.json — você não precisa repetir toda vez.

ℹ️ Para leigos: Você não precisa saber programar. O assistente vai guiando com perguntas simples. Se não souber alguma resposta, pode digitar "pular" e configurar depois.

👤 Sobre o seu perfil

Qual é o seu nome ou nome do perfil?

Como você assina seu conteúdo no Instagram. Vai aparecer no badge de identificação dos slides.

💬 Exemplos: "Maria | Finanças", "Rafael Crypto", "Ana Negócios", "Lucas | Marketing"

📝 Texto livre

Qual é o seu @handle do Instagram?

O @ do seu perfil. Também aparece no badge dos slides como elemento visual.

💬 Exemplos: @maria.financas, @rafaelcrypto, @ananego

📝 Texto começando com @

Qual é o seu nicho de atuação?

Define o vocabulário, exemplos e referências que serão usados nos roteiros.

Cripto / DeFi / Web3 Finanças pessoais / Investimentos Negócios / Empreendedorismo Marketing / Vendas Tecnologia / IA Saúde / Bem-estar Educação Outro (descrever)

Qual é o seu tom de voz padrão?

Como você gosta de se comunicar com sua audiência. Isso define o estilo dos textos dos slides e das legendas.

Provocador / Direto (choca, questiona, confronta) Educativo / Didático (explica com paciência, usa exemplos) Técnico / Analítico (dados, gráficos, profundidade) Informal / Próximo (como conversa com amigo) Formal / Institucional (sério, corporativo)

Em qual idioma você produz conteúdo?

Português (Brasil) English Español

🔗 Fontes de Conteúdo

Você vai usar o X (Twitter) como fonte de conteúdo?

Se sim, o assistente pode buscar tweets, threads e análises diretamente do X para usar como base dos carrosseis. Requer configuração da API.

Sim, quero usar o X como fonte Não por agora — vou colar o texto ou link manualmente

Se escolher "Sim": o assistente vai guiar a configuração da API do X (Twitter) separadamente.

Quais outras fontes você quer usar?

O assistente pode buscar conteúdo de diversas fontes para montar o roteiro do carrossel.

Links de artigos / notícias (você cola a URL) PDFs e relatórios (você envia o arquivo) YouTube (você cola o link do vídeo) Texto livre (você digita o resumo) Pesquisa automática na web pelo tema

🖼️ Badge e Identidade Visual

Vai usar Badge de Identificação nos slides?

O badge é a sua "assinatura visual" — aparece no topo de cada slide de conteúdo com sua foto de perfil, nome e @handle. Ajuda o leitor a identificar quem criou o carrossel enquanto está passando os slides.

badge-black.png

Versão escura

Para slides de fundo branco

badge-white.png

Versão clara

Para slides de fundo preto (capa + CTA)

📐 Requisitos do arquivo:

✅ Formato PNG com fundo transparente (não JPG — JPG não tem transparência)
✅ Tamanho mínimo: 400×80px (formato horizontal/wide)
✅ Conteúdo: foto circular + nome + @handle lado a lado
✅ Pode exportar do Figma, Canva (PNG com fundo transparente) ou Photoshop

Sim — vou enviar meus 2 PNGs Sim — quero que a IA gere automaticamente Não por agora — usar badge genérico

🔑 API de Geração de Imagens

Você usa o 1Password como gerenciador de senhas?

O 1Password é um cofre digital que guarda suas senhas e chaves de API com segurança. Se você já o usa, o skill pode buscar suas credenciais diretamente de lá — sem você precisar colar a chave toda vez e sem ela ficar exposta em arquivos de texto.

✅ Com 1Password

As chaves ficam no cofre do 1Password. O assistente usa op read para buscar automaticamente — zero exposição, zero digitação.

Ideal para quem já usa e preza por segurança máxima.

📄 Sem 1Password

As chaves ficam salvas em variável de ambiente local (.env) ou no config.json da skill. Simples de configurar, funciona normalmente.

Adequado para uso pessoal em máquina própria.

Sim — uso 1Password (informar vault name) Não — prefiro usar variável de ambiente (.env) Não sei / não uso gerenciador de senhas

ℹ️ Não usa nenhum gerenciador? Tudo bem — o assistente vai pedir a API Key uma vez e salvar em arquivo local protegido. Você não precisará digitar novamente.

Configure sua API do Google Gemini (Imagen 3)

As imagens dos carrosseis são geradas pelo Google Imagen 3 — o modelo de imagem mais avançado disponível atualmente. Não recomendamos outros providers (Midjourney, DALL-E, etc.) pois o estilo e qualidade foram otimizados especificamente para o Imagen 3.

Como obter sua API Key gratuita:

Acesse aistudio.google.com
Faça login com sua conta Google
Clique em "Get API Key" no menu lateral
Clique em "Create API Key"
Copie a chave gerada e cole aqui no assistente

💰 Custo: tier gratuito disponível com limites diários. Para uso intenso (~50+ carrosseis/mês), o custo é de aproximadamente $0,04 por imagem gerada.

🔐 A chave é salva com segurança no seu ambiente local — nunca compartilhada

📦 Entrega e Armazenamento

Onde quer receber os slides prontos?

Após o render, o assistente envia os PNGs prontos para onde você preferir.

Telegram (informar Chat ID) WhatsApp Só salvar na pasta local

Quer arquivar os carrosseis no Google Drive?

Se sim, cada carrossel é salvo automaticamente em uma pasta organizada por data e tema. Útil para manter histórico e acessar de qualquer dispositivo.

Sim — informar ID da pasta no Drive Não por agora

Se escolher "Sim": o assistente vai guiar a configuração do Google Drive separadamente.

🤖 Modo de Operação

Prefere controlar o processo ou receber tudo automático?

Define se o assistente vai pedir sua aprovação antes de avançar, ou vai entregar o carrossel completo sem interrupções.

Autônomo — entrega sem me perguntar Semi-autônomo — quero aprovar o ângulo e o CTA antes de gerar

💡 Recomendamos começar no modo semi-autônomo para validar o estilo antes de automatizar completamente.

✅ Pronto! Configuração salva.

Agora é só dizer: "Cria um carrossel sobre [seu tema]" e o assistente cuida do resto. Para mudar qualquer configuração depois, use /carrossel-setup.

💸 Quanto vai custar?

Estimativa por carrossel completo (10 slides + 5–6 imagens geradas):

~R$2

Por carrossel completo

~R$60

30 carrosseis/mês

75%

Do custo = imagens

💡 Para reduzir custo: usar menos imagens contextuais (3 em vez de 5–6 por carrossel) reduz para ~R$1,20 por carrossel.

Badge do perfil — 2 versões obrigatórias

O badge aparece no topo de todos os slides de texto. Como os slides têm fundos diferentes, são necessárias duas versões:

badge-black.png

Texto escuro

Usado nos slides de fundo branco (texto_cheio e texto_curto_imagem)

badge-white.png

Texto claro

Usado na capa e no slide CTA (capa e cta_preto)

📐 Requisitos técnicos do PNG:

✅ Fundo transparente (alpha channel) — nunca fundo branco ou preto
✅ Resolução mínima: 400×80px (horizontal, formato wide)
✅ Conteúdo: foto de perfil (circular) + nome + @handle
✅ Exportar do Figma, Canva ou Photoshop em PNG-24 com transparência
❌ Nunca JPG (não suporta transparência)

📎 Upload de 2 arquivos PNG: badge-black.png + badge-white.png — ou gerar automaticamente

Upload meus 2 PNGs Gerar automaticamente com IA

Nicho / Tema principal

Define o vocabulário, referências e exemplos que o COPYWRITER vai usar nos roteiros.

Cripto / DeFi Finanças pessoais Negócios / Empreendedorismo Tecnologia / IA Marketing Outro (descrever)

Tom de voz

Influencia o estilo de escrita dos slides, ganchos e CTAs.

Provocador / Direto Educativo / Didático Técnico / Analítico Informal / Próximo Formal / Institucional

Idioma

Português BR English Español

🔑 APIs e Integrações

API Key — Nano Banana Pro (Google AI Studio)

Usada para gerar todas as imagens (capas + imagens contextuais) via Google Imagen 3.
Obter em: aistudio.google.com → API Keys — tier gratuito disponível com limites diários.

🔐 Salvo no 1Password vault ou variável de ambiente GEMINI_API_KEY

Google Drive (opcional)

Faz upload automático de todos os arquivos do carrossel (PNGs + legendas.txt) em uma pasta organizada por data/tema.

📂 ID da pasta Drive (opcional) — ou desativar

Ativar (informar ID da pasta) Desativar

Canal de entrega

Onde os slides renderizados serão enviados após o render.

Telegram (informar chat ID + topic ID) WhatsApp Só salvar localmente

🤖 Modo de Operação

Autonomia do fluxo

Define se o assistente pede aprovação antes de avançar, ou entrega sem interrupções.

Autônomo total — entrega sem perguntar Semi-autônomo — pausa para aprovar ângulo + CTA

🤖 Modos de Operação

🚀

Modo Autônomo

Padrão

✅ Pesquisa a fonte automaticamente
✅ Escolhe o ângulo mais forte
✅ Define o CTA contextualizado
✅ Gera roteiro + capas + imagens
✅ Renderiza + envia + faz upload
✅ Zero interrupções do usuário

Ideal para quem quer produção em escala sem precisar revisar cada passo.

⏸️

Modo Semi-Autônomo

Controle total

✅ Pesquisa a fonte automaticamente
⏸️ Propõe 3 ângulos → aguarda escolha
⏸️ Propõe CTA → aguarda confirmação
✅ Gera roteiro + capas + imagens
✅ Renderiza + envia + faz upload

Ideal para quem quer controle editorial sobre o ângulo e mensagem do carrossel.

🏗️ Arquitetura — Agente Único

✅ Agente único — sem dependências externas

O CarrosselAI funciona com qualquer assistente OpenClaw padrão. Não requer configuração de múltiplos agentes, sessões paralelas ou sub-agentes especializados. Tudo roda sequencialmente na mesma sessão, usando as ferramentas nativas do OpenClaw.

🔧

Ferramentas utilizadas

✅ web_search / web_fetch — pesquisa
✅ exec — gerar imagens + render
✅ write / read — arquivos
✅ message — entregar slides
🔑 Nano Banana Pro (Imagen 3) via API key
📂 Google Drive via gogcli (opcional)

⚡

Compatibilidade

✅ Qualquer OpenClaw padrão
✅ Sem configuração de multi-agente
✅ Sem agents.json personalizado
✅ Sem sessions_spawn ou sub-agentes
✅ Node.js + Puppeteer no host
✅ API key Google AI Studio (gratuita)

🔄 Fluxo de Execução

O agente principal executa todos os passos sequencialmente na mesma sessão. Sem spawnar sub-agentes.

Passo 1 — Pesquisa

AGENTE PRINCIPAL

Lê fonte (URL, Twitter, PDF, texto colado) via web_search / web_fetch

↓

Passo 2 — Ângulos

AGENTE PRINCIPAL

Propõe 3 ângulos com gatilho emocional de cada

↓

⏸️ Pausa (Semi-Autônomo) ou decisão interna (Autônomo)

USUÁRIO

Escolhe ângulo + confirma CTA

↓

Passo 3 — Roteiro + Legendas

AGENTE PRINCIPAL

Gera 10 slides completos + 3 variações de legenda

↓

Passo 4 — Capas

AGENTE PRINCIPAL

Propõe 5 variações de capa com JSON completo

↓

Passo 5 — Geração de Imagens

AGENTE PRINCIPAL

Gera capa (4:5, 2K) + imagens contextuais (3:2, 1K) via exec → Imagen 3

↓

Passo 6 — Render + Entrega

AGENTE PRINCIPAL

Render Puppeteer (render-carousel.js) → envia slides → upload Drive (opcional)

⏱️ Tempo total estimado: ~8–12 minutos do brief à entrega (vs ~5–8 min na versão multi-agente interna). A diferença é pela execução sequencial — cada passo espera o anterior completar.

📐 Tipos de Slide

O render engine (render-carousel.js) suporta 4 layouts. O COPYWRITER escolhe o tipo correto para cada slide com base na densidade do conteúdo.

capa

Slide de Capa

Imagem full-bleed (4:5) com gradiente escuro no terço inferior, headline em amarelo neon e badge branco. Sem texto de corpo.

HEADLINE IMPACTANTE

texto_cheio

Texto Cheio

Fundo branco, badge no topo, texto grande ocupa toda a área. Usado quando há 4+ linhas de conteúdo. Sem imagem.

Texto educativo
com conteúdo denso
e dados relevantes
que precisam de espaço

texto_curto_imagem

Texto Curto + Imagem

Fundo branco, badge no topo, texto curto (até 3 linhas) + imagem contextual 3:2 embaixo com rounded corners.

Texto curto aqui

cta_preto

CTA Final

Fundo preto, badge, texto de CTA contextualizado em branco. Linha de acento vermelha acima do texto. Último slide obrigatório.

Segue pra não perder
o próximo antes do mercado.

📏 Regra de densidade: Slides com 3 linhas ou menos → texto_curto_imagem. Slides com 4+ linhas → texto_cheio, sem imagem. Prioridade: legibilidade.

🎨 Tipos de Capa

10 tipos catalogados no banco-capas. O DESIGNER escolhe o tipo que melhor amplifica o gatilho emocional do ângulo. Cada variação de capa entregue com JSON completo pronto para gerar via Imagen 3.

HEADLINE EM CAIXA ALTA

Tipo 1

Cenário Macro

Vista ampla de cidade, economia, sistemas. Escala + impotência.

HEADLINE URGENTE

Tipo 2

Crise / Colapso

Gráficos caindo, destruição sistêmica. Urgência e medo.

HEADLINE REVELAÇÃO

Tipo 3

Revelação / Oportunidade

Luz no fundo do túnel. Epifania. Dado oculto revelado.

CONSPIRAÇÃO

Tipo 4

Conspiração / Sistema

Sombras, poder oculto, redes de controle. Desconfiança.

DADO: $1.000.000

Tipo 5

Dado Âncora

Número impactante em destaque absoluto. Choque de escala.

LINHA DO TEMPO

Tipo 6

Vista Aérea / Infraestrutura

Fotografia aérea noturna. Escala física impressionante.

Tipo 7

Confronto / Versus

Dois lados em conflito. Força vs fraqueza. Antes vs depois.

SILHUETA

Tipo 8

Silhueta / Identidade

Figura humana + contexto simbólico. Protagonismo do leitor.

MACRO + DETALHE

Tipo 9

Objeto Simbólico

Objeto único em closeup extremo. Metáfora condensada.

MATRIX DATA

Tipo 10

Dado / Visualização

Gráfico, chart ou fluxo como arte. Dados viram estética.

🖼️ Imagens Contextuais

Imagens geradas para os slides do tipo texto_curto_imagem. Aparecem abaixo do texto, com rounded corners e padding lateral.

📐

Formato: 3:2 Landscape

Container do slide é 956×650px (proporção 3:2). Imagens devem ser geradas em --aspect-ratio 3:2. Usar 1:1 gera espaço morto e crop errado.

🎯

Composição Tight

O elemento principal deve ocupar 70-80% do frame. Zero espaço morto ao redor. Sujeito próximo às bordas do frame.

🚫

Sem Gradiente Escuro

Gradiente de fade para preto é regra exclusiva da capa. Imagens contextuais têm fundo limpo — nunca degradê escuro nas bordas.

🎨

Conceitual e Metafórica

Cada slide recebe uma imagem exclusiva baseada no gatilho emocional daquele slide. Nunca reutilizar a capa ou outra imagem contextual.

⚙️ Render Engine
object-fit: cover + object-position: center center + background: #FFFFFF + border-radius: 16px
Não alterar esses parâmetros — validados após múltiplas iterações.

📣 Tipos de CTA

O CTA sempre aparece no último slide (cta_preto). Deve ser contextualizado com a narrativa do carrossel — nunca genérico.

🚨

CTA Urgência

Sensação de que o momento é agora. Usado quando o carrossel revela uma janela de oportunidade ou ameaça iminente.

"Isso vai mudar nos próximos 90 dias.
Segue pra estar por dentro antes."

🔮

CTA Revelação / FOMO

O leitor sente que descobriu algo que poucos sabem. Medo de ficar de fora do próximo conteúdo importante.

"O próximo padrão já está se formando.
Segue aqui pra não perder."

🎓

CTA Educativo

Posiciona o criador como professor. Quem segue vai aprender antes dos outros e tomar decisões melhores.

"Quem entendeu isso em 2020 saiu na frente.
Me segue pra entender o que vem agora."

🪞

CTA Identificação

O leitor se vê na situação descrita. CTA convida para continuar a jornada junto.

"Se você ainda não sabia disso,
aqui é o lugar certo pra começar."

❌ CTA Proibido: "Segue o perfil e compartilha" / "@handle" como linha isolada / mencionar nome de produto ou comunidade como entidade. O CTA promove SEMPRE o perfil pessoal do criador.

💰 Custo por Carrossel

Estimativa baseada em carrossel completo: 10 slides + capa + 5–6 imagens contextuais + 3 legendas.

Item	Modelo/API	Qtd	Custo Unit.	Subtotal
Capa (4:5, 2K)	Imagen 3	1	~$0,04	~$0,04
Imagens contextuais (3:2, 1K)	Imagen 3	5-6	~$0,04	~$0,20-0,24
COPYWRITER (roteiro + legendas)	Claude Haiku	~30k tokens	-	~$0,01
NERD (pesquisa)	Claude Haiku	~10k tokens	-	~$0,005
DESIGNER (coordenação)	Gemini Flash	~8k tokens	-	<$0,01
DEV (render + entrega)	Claude Haiku	~5k tokens	-	~$0,005
Render (Puppeteer local)	—	—	—	$0
Drive / Telegram	—	—	—	$0

Total estimado por carrossel

~75% do custo = geração de imagens

~$0,30–0,45

≈ R$1,75–2,60 BRL

💡 Para reduzir custo: gerar 3 imagens contextuais em vez de 5-6 → cai para ~$0,20 por carrossel.

📋 Regras Permanentes

✅ Correto

Imagens contextuais em 3:2 landscape

❌ Proibido

Imagens contextuais em 1:1 ou 4:5

✅ Correto

Elemento principal ocupa 70-80% do frame

❌ Proibido

Sujeito pequeno com fundo vazio ao redor

✅ Correto

Gradiente escuro exclusivo na capa

❌ Proibido

Gradiente/fade preto em imagem contextual

✅ Correto

Slides 4+ linhas → texto_cheio

❌ Proibido

Slides densos como texto_curto_imagem

✅ Correto

CTA contextualizado com o tema do carrossel

❌ Proibido

"Segue o perfil e compartilha" (genérico)

✅ Correto

\n entre parágrafos ou bullets distintos

❌ Proibido

Traços (—) em qualquer campo de texto

✅ Correto

Cada slide curto tem imagem exclusiva

❌ Proibido

Reutilizar a capa ou outra imagem contextual

✅ Correto

Fear & Greed como dado de suporte máx 1x

❌ Proibido

F&G como ângulo central do carrossel

🗺️ Roadmap

Fase	Descrição	Status
v1.0	Engine completo: pesquisa → roteiro → imagens → render → entrega Telegram + Drive	Ativo
v1.1	Setup wizard interativo no primeiro boot (config.json automático)	Em desenvolvimento
v1.2	Geração automática de badge para quem não tiver PNG próprio	Planejado
v2.0	Postagem automática no Instagram via Graph API (imediata ou agendada com data/hora BRT)	Roadmap
v2.1	Analytics pós-postagem: métricas de alcance, engajamento, salvamentos, compartilhamentos	Roadmap
v3.0	Multi-idioma nativo (EN + ES) com banco de capas localizado	Roadmap

💡 Sugestões de Evolução Pós-Validação

Após validar o processo com pelo menos 10 carrosseis entregues, recomenda-se avaliar as expansões abaixo:

📡

Fonte de Conteúdo Automatizada

Vincular uma fonte de dados recorrente (newsletter, RSS, conta do Twitter/X, canal do YouTube) para que o skill monitore automaticamente e dispare a produção de um carrossel quando detectar conteúdo relevante.

Fontes suportadas: Twitter/X via bird CLI · RSS feeds · YouTube (transcrição automática) · newsletters por e-mail · PDFs de relatórios

v3.1 — Roadmap

📲

Postagem Automática no Instagram

Após render e aprovação (ou em modo totalmente autônomo), o skill posta o carrossel diretamente no Instagram via Meta Graph API — com legenda, hashtags e agendamento de horário.

Funcionalidades: Postagem imediata ou agendada · Seleção de legenda (1 de 3 variações) · Hashtags automáticas por nicho · Relatório de publicação

v2.0 — Roadmap Requer: Meta App + permissão instagram_content_publish