🎠 CarrosselAI Skill
Engine completo de produção de carrosseis Instagram com IA. Da pesquisa à entrega: pesquisa de fonte, roteiro, capas, imagens, render e upload — tudo executado pelo seu agente OpenClaw, sem configuração extra.
💡 O que é o CarrosselAI?
Você digita um tema ou cola o link de uma notícia. O assistente pesquisa, escreve o roteiro, gera as imagens, monta os slides e envia tudo pronto para o seu Telegram ou WhatsApp — em menos de 10 minutos, sem você precisar abrir Canva, Photoshop ou qualquer outro programa.
👥 Para quem é
Quer postar conteúdo de qualidade sem passar horas no Canva.
Criador que quer escalar produção de 2 para 15 posts/mês.
Empreendedora que quer presença no Instagram sem contratar designer.
Agência que quer automatizar produção de conteúdo para múltiplos clientes.
📦 Instalação
Instalar via ClawHub
No terminal do seu OpenClaw: clawhub install carrossel-ai
Ou clonar o repositório
git clone https://github.com/openclaw-skills/carrossel-ai cp -r carrossel-ai ~/.openclaw/workspace/skills/carrossel-ai
Instalar dependências de render
cd ~/.openclaw/workspace npm install puppeteer # Puppeteer fará download do Chromium automaticamente
Responder o questionário de configuração
Na primeira vez que chamar o skill, o assistente faz as perguntas da seção abaixo e salva tudo automaticamente. Pode refazer a qualquer momento com /carrossel-setup.
⚙️ Questionário de Configuração
O assistente faz estas perguntas uma a uma na primeira execução. Leva menos de 3 minutos. Todas as respostas ficam salvas em config.json — você não precisa repetir toda vez.
👤 Sobre o seu perfil
Qual é o seu nome ou nome do perfil?
Como você assina seu conteúdo no Instagram. Vai aparecer no badge de identificação dos slides.
Qual é o seu @handle do Instagram?
O @ do seu perfil. Também aparece no badge dos slides como elemento visual.
Qual é o seu nicho de atuação?
Define o vocabulário, exemplos e referências que serão usados nos roteiros.
Qual é o seu tom de voz padrão?
Como você gosta de se comunicar com sua audiência. Isso define o estilo dos textos dos slides e das legendas.
Em qual idioma você produz conteúdo?
🔗 Fontes de Conteúdo
Você vai usar o X (Twitter) como fonte de conteúdo?
Se sim, o assistente pode buscar tweets, threads e análises diretamente do X para usar como base dos carrosseis. Requer configuração da API.
Quais outras fontes você quer usar?
O assistente pode buscar conteúdo de diversas fontes para montar o roteiro do carrossel.
🖼️ Badge e Identidade Visual
Vai usar Badge de Identificação nos slides?
O badge é a sua "assinatura visual" — aparece no topo de cada slide de conteúdo com sua foto de perfil, nome e @handle. Ajuda o leitor a identificar quem criou o carrossel enquanto está passando os slides.
- ✅ Formato PNG com fundo transparente (não JPG — JPG não tem transparência)
- ✅ Tamanho mínimo: 400×80px (formato horizontal/wide)
- ✅ Conteúdo: foto circular + nome + @handle lado a lado
- ✅ Pode exportar do Figma, Canva (PNG com fundo transparente) ou Photoshop
🔑 API de Geração de Imagens
Você usa o 1Password como gerenciador de senhas?
O 1Password é um cofre digital que guarda suas senhas e chaves de API com segurança. Se você já o usa, o skill pode buscar suas credenciais diretamente de lá — sem você precisar colar a chave toda vez e sem ela ficar exposta em arquivos de texto.
As chaves ficam no cofre do 1Password. O assistente usa op read para buscar automaticamente — zero exposição, zero digitação.
As chaves ficam salvas em variável de ambiente local (.env) ou no config.json da skill. Simples de configurar, funciona normalmente.
Configure sua API do Google Gemini (Imagen 3)
As imagens dos carrosseis são geradas pelo Google Imagen 3 — o modelo de imagem mais avançado disponível atualmente. Não recomendamos outros providers (Midjourney, DALL-E, etc.) pois o estilo e qualidade foram otimizados especificamente para o Imagen 3.
- Acesse
aistudio.google.com - Faça login com sua conta Google
- Clique em "Get API Key" no menu lateral
- Clique em "Create API Key"
- Copie a chave gerada e cole aqui no assistente
📦 Entrega e Armazenamento
Onde quer receber os slides prontos?
Após o render, o assistente envia os PNGs prontos para onde você preferir.
Quer arquivar os carrosseis no Google Drive?
Se sim, cada carrossel é salvo automaticamente em uma pasta organizada por data e tema. Útil para manter histórico e acessar de qualquer dispositivo.
🤖 Modo de Operação
Prefere controlar o processo ou receber tudo automático?
Define se o assistente vai pedir sua aprovação antes de avançar, ou vai entregar o carrossel completo sem interrupções.
Agora é só dizer: "Cria um carrossel sobre [seu tema]" e o assistente cuida do resto. Para mudar qualquer configuração depois, use /carrossel-setup.
💸 Quanto vai custar?
Estimativa por carrossel completo (10 slides + 5–6 imagens geradas):
💡 Para reduzir custo: usar menos imagens contextuais (3 em vez de 5–6 por carrossel) reduz para ~R$1,20 por carrossel.
Badge do perfil — 2 versões obrigatórias
O badge aparece no topo de todos os slides de texto. Como os slides têm fundos diferentes, são necessárias duas versões:
texto_cheio e texto_curto_imagem)capa e cta_preto)- ✅ Fundo transparente (alpha channel) — nunca fundo branco ou preto
- ✅ Resolução mínima: 400×80px (horizontal, formato wide)
- ✅ Conteúdo: foto de perfil (circular) + nome + @handle
- ✅ Exportar do Figma, Canva ou Photoshop em PNG-24 com transparência
- ❌ Nunca JPG (não suporta transparência)
Nicho / Tema principal
Define o vocabulário, referências e exemplos que o COPYWRITER vai usar nos roteiros.
Tom de voz
Influencia o estilo de escrita dos slides, ganchos e CTAs.
Idioma
🔑 APIs e Integrações
API Key — Nano Banana Pro (Google AI Studio)
Usada para gerar todas as imagens (capas + imagens contextuais) via Google Imagen 3.
Obter em: aistudio.google.com → API Keys — tier gratuito disponível com limites diários.
Google Drive (opcional)
Faz upload automático de todos os arquivos do carrossel (PNGs + legendas.txt) em uma pasta organizada por data/tema.
Canal de entrega
Onde os slides renderizados serão enviados após o render.
🤖 Modo de Operação
Autonomia do fluxo
Define se o assistente pede aprovação antes de avançar, ou entrega sem interrupções.
🤖 Modos de Operação
Modo Autônomo
Padrão- ✅ Pesquisa a fonte automaticamente
- ✅ Escolhe o ângulo mais forte
- ✅ Define o CTA contextualizado
- ✅ Gera roteiro + capas + imagens
- ✅ Renderiza + envia + faz upload
- ✅ Zero interrupções do usuário
Ideal para quem quer produção em escala sem precisar revisar cada passo.
Modo Semi-Autônomo
Controle total- ✅ Pesquisa a fonte automaticamente
- ⏸️ Propõe 3 ângulos → aguarda escolha
- ⏸️ Propõe CTA → aguarda confirmação
- ✅ Gera roteiro + capas + imagens
- ✅ Renderiza + envia + faz upload
Ideal para quem quer controle editorial sobre o ângulo e mensagem do carrossel.
🏗️ Arquitetura — Agente Único
O CarrosselAI funciona com qualquer assistente OpenClaw padrão. Não requer configuração de múltiplos agentes, sessões paralelas ou sub-agentes especializados. Tudo roda sequencialmente na mesma sessão, usando as ferramentas nativas do OpenClaw.
Ferramentas utilizadas
- ✅
web_search/web_fetch— pesquisa - ✅
exec— gerar imagens + render - ✅
write/read— arquivos - ✅
message— entregar slides - 🔑 Nano Banana Pro (Imagen 3) via API key
- 📂 Google Drive via gogcli (opcional)
Compatibilidade
- ✅ Qualquer OpenClaw padrão
- ✅ Sem configuração de multi-agente
- ✅ Sem agents.json personalizado
- ✅ Sem sessions_spawn ou sub-agentes
- ✅ Node.js + Puppeteer no host
- ✅ API key Google AI Studio (gratuita)
🔄 Fluxo de Execução
O agente principal executa todos os passos sequencialmente na mesma sessão. Sem spawnar sub-agentes.
📐 Tipos de Slide
O render engine (render-carousel.js) suporta 4 layouts. O COPYWRITER escolhe o tipo correto para cada slide com base na densidade do conteúdo.
texto_curto_imagem. Slides com 4+ linhas → texto_cheio, sem imagem. Prioridade: legibilidade.
🎨 Tipos de Capa
10 tipos catalogados no banco-capas. O DESIGNER escolhe o tipo que melhor amplifica o gatilho emocional do ângulo. Cada variação de capa entregue com JSON completo pronto para gerar via Imagen 3.
Cenário Macro
Vista ampla de cidade, economia, sistemas. Escala + impotência.
Crise / Colapso
Gráficos caindo, destruição sistêmica. Urgência e medo.
Revelação / Oportunidade
Luz no fundo do túnel. Epifania. Dado oculto revelado.
Conspiração / Sistema
Sombras, poder oculto, redes de controle. Desconfiança.
Dado Âncora
Número impactante em destaque absoluto. Choque de escala.
Vista Aérea / Infraestrutura
Fotografia aérea noturna. Escala física impressionante.
Confronto / Versus
Dois lados em conflito. Força vs fraqueza. Antes vs depois.
Silhueta / Identidade
Figura humana + contexto simbólico. Protagonismo do leitor.
Objeto Simbólico
Objeto único em closeup extremo. Metáfora condensada.
Dado / Visualização
Gráfico, chart ou fluxo como arte. Dados viram estética.
🖼️ Imagens Contextuais
Imagens geradas para os slides do tipo texto_curto_imagem. Aparecem abaixo do texto, com rounded corners e padding lateral.
Formato: 3:2 Landscape
Container do slide é 956×650px (proporção 3:2). Imagens devem ser geradas em --aspect-ratio 3:2. Usar 1:1 gera espaço morto e crop errado.
Composição Tight
O elemento principal deve ocupar 70-80% do frame. Zero espaço morto ao redor. Sujeito próximo às bordas do frame.
Sem Gradiente Escuro
Gradiente de fade para preto é regra exclusiva da capa. Imagens contextuais têm fundo limpo — nunca degradê escuro nas bordas.
Conceitual e Metafórica
Cada slide recebe uma imagem exclusiva baseada no gatilho emocional daquele slide. Nunca reutilizar a capa ou outra imagem contextual.
object-fit: cover + object-position: center center + background: #FFFFFF + border-radius: 16pxNão alterar esses parâmetros — validados após múltiplas iterações.
📣 Tipos de CTA
O CTA sempre aparece no último slide (cta_preto). Deve ser contextualizado com a narrativa do carrossel — nunca genérico.
CTA Urgência
Sensação de que o momento é agora. Usado quando o carrossel revela uma janela de oportunidade ou ameaça iminente.
Segue pra estar por dentro antes."
CTA Revelação / FOMO
O leitor sente que descobriu algo que poucos sabem. Medo de ficar de fora do próximo conteúdo importante.
Segue aqui pra não perder."
CTA Educativo
Posiciona o criador como professor. Quem segue vai aprender antes dos outros e tomar decisões melhores.
Me segue pra entender o que vem agora."
CTA Identificação
O leitor se vê na situação descrita. CTA convida para continuar a jornada junto.
aqui é o lugar certo pra começar."
💰 Custo por Carrossel
Estimativa baseada em carrossel completo: 10 slides + capa + 5–6 imagens contextuais + 3 legendas.
| Item | Modelo/API | Qtd | Custo Unit. | Subtotal |
|---|---|---|---|---|
| Capa (4:5, 2K) | Imagen 3 | 1 | ~$0,04 | ~$0,04 |
| Imagens contextuais (3:2, 1K) | Imagen 3 | 5-6 | ~$0,04 | ~$0,20-0,24 |
| COPYWRITER (roteiro + legendas) | Claude Haiku | ~30k tokens | - | ~$0,01 |
| NERD (pesquisa) | Claude Haiku | ~10k tokens | - | ~$0,005 |
| DESIGNER (coordenação) | Gemini Flash | ~8k tokens | - | <$0,01 |
| DEV (render + entrega) | Claude Haiku | ~5k tokens | - | ~$0,005 |
| Render (Puppeteer local) | — | — | — | $0 |
| Drive / Telegram | — | — | — | $0 |
💡 Para reduzir custo: gerar 3 imagens contextuais em vez de 5-6 → cai para ~$0,20 por carrossel.
📋 Regras Permanentes
Imagens contextuais em 3:2 landscape
Imagens contextuais em 1:1 ou 4:5
Elemento principal ocupa 70-80% do frame
Sujeito pequeno com fundo vazio ao redor
Gradiente escuro exclusivo na capa
Gradiente/fade preto em imagem contextual
Slides 4+ linhas → texto_cheio
Slides densos como texto_curto_imagem
CTA contextualizado com o tema do carrossel
"Segue o perfil e compartilha" (genérico)
\n entre parágrafos ou bullets distintos
Traços (—) em qualquer campo de texto
Cada slide curto tem imagem exclusiva
Reutilizar a capa ou outra imagem contextual
Fear & Greed como dado de suporte máx 1x
F&G como ângulo central do carrossel
🗺️ Roadmap
| Fase | Descrição | Status |
|---|---|---|
| v1.0 | Engine completo: pesquisa → roteiro → imagens → render → entrega Telegram + Drive | Ativo |
| v1.1 | Setup wizard interativo no primeiro boot (config.json automático) | Em desenvolvimento |
| v1.2 | Geração automática de badge para quem não tiver PNG próprio | Planejado |
| v2.0 | Postagem automática no Instagram via Graph API (imediata ou agendada com data/hora BRT) | Roadmap |
| v2.1 | Analytics pós-postagem: métricas de alcance, engajamento, salvamentos, compartilhamentos | Roadmap |
| v3.0 | Multi-idioma nativo (EN + ES) com banco de capas localizado | Roadmap |
💡 Sugestões de Evolução Pós-Validação
Após validar o processo com pelo menos 10 carrosseis entregues, recomenda-se avaliar as expansões abaixo:
Fonte de Conteúdo Automatizada
Vincular uma fonte de dados recorrente (newsletter, RSS, conta do Twitter/X, canal do YouTube) para que o skill monitore automaticamente e dispare a produção de um carrossel quando detectar conteúdo relevante.
Postagem Automática no Instagram
Após render e aprovação (ou em modo totalmente autônomo), o skill posta o carrossel diretamente no Instagram via Meta Graph API — com legenda, hashtags e agendamento de horário.
instagram_content_publish