v1.0 OpenClaw Compatible Spec criada em 23/03/2026

🎠 CarrosselAI Skill

Engine completo de produção de carrosseis Instagram com IA. Da pesquisa à entrega: pesquisa de fonte, roteiro, capas, imagens, render e upload — tudo executado pelo seu agente OpenClaw, sem configuração extra.

Agente Único Nano Banana Pro (Imagen 3) Render Puppeteer Google Drive (opcional) Telegram / WhatsApp
~8min
Do brief à entrega
10
Tipos de capa
4
Tipos de slide
~R$2
Custo por carrossel

💡 O que é o CarrosselAI?

Você digita um tema ou cola o link de uma notícia. O assistente pesquisa, escreve o roteiro, gera as imagens, monta os slides e envia tudo pronto para o seu Telegram ou WhatsApp — em menos de 10 minutos, sem você precisar abrir Canva, Photoshop ou qualquer outro programa.

🗣️
Você fala o tema
"Quero um carrossel sobre Bitcoin e inflação"
🤖
A IA faz tudo
Pesquisa, escreve, gera imagens, monta slides
📲
Você recebe pronto
Slides PNG + legendas no seu Telegram

👥 Para quem é

Maria | Finanças Pessoais
Quer postar conteúdo de qualidade sem passar horas no Canva.
Rafael | Investimentos
Criador que quer escalar produção de 2 para 15 posts/mês.
Ana | Negócios Digitais
Empreendedora que quer presença no Instagram sem contratar designer.
Lucas | Marketing & IA
Agência que quer automatizar produção de conteúdo para múltiplos clientes.

📦 Instalação

Instalar via ClawHub

No terminal do seu OpenClaw: clawhub install carrossel-ai

Ou clonar o repositório

git clone https://github.com/openclaw-skills/carrossel-ai
cp -r carrossel-ai ~/.openclaw/workspace/skills/carrossel-ai

Instalar dependências de render

cd ~/.openclaw/workspace
npm install puppeteer
# Puppeteer fará download do Chromium automaticamente

Responder o questionário de configuração

Na primeira vez que chamar o skill, o assistente faz as perguntas da seção abaixo e salva tudo automaticamente. Pode refazer a qualquer momento com /carrossel-setup.

⚙️ Questionário de Configuração

O assistente faz estas perguntas uma a uma na primeira execução. Leva menos de 3 minutos. Todas as respostas ficam salvas em config.json — você não precisa repetir toda vez.

ℹ️ Para leigos: Você não precisa saber programar. O assistente vai guiando com perguntas simples. Se não souber alguma resposta, pode digitar "pular" e configurar depois.

👤 Sobre o seu perfil

1

Qual é o seu nome ou nome do perfil?

Como você assina seu conteúdo no Instagram. Vai aparecer no badge de identificação dos slides.

💬 Exemplos: "Maria | Finanças", "Rafael Crypto", "Ana Negócios", "Lucas | Marketing"
📝 Texto livre
2

Qual é o seu @handle do Instagram?

O @ do seu perfil. Também aparece no badge dos slides como elemento visual.

💬 Exemplos: @maria.financas, @rafaelcrypto, @ananego
📝 Texto começando com @
3

Qual é o seu nicho de atuação?

Define o vocabulário, exemplos e referências que serão usados nos roteiros.

Cripto / DeFi / Web3 Finanças pessoais / Investimentos Negócios / Empreendedorismo Marketing / Vendas Tecnologia / IA Saúde / Bem-estar Educação Outro (descrever)
4

Qual é o seu tom de voz padrão?

Como você gosta de se comunicar com sua audiência. Isso define o estilo dos textos dos slides e das legendas.

Provocador / Direto (choca, questiona, confronta) Educativo / Didático (explica com paciência, usa exemplos) Técnico / Analítico (dados, gráficos, profundidade) Informal / Próximo (como conversa com amigo) Formal / Institucional (sério, corporativo)
5

Em qual idioma você produz conteúdo?

Português (Brasil) English Español

🔗 Fontes de Conteúdo

6

Você vai usar o X (Twitter) como fonte de conteúdo?

Se sim, o assistente pode buscar tweets, threads e análises diretamente do X para usar como base dos carrosseis. Requer configuração da API.

Sim, quero usar o X como fonte Não por agora — vou colar o texto ou link manualmente
Se escolher "Sim": o assistente vai guiar a configuração da API do X (Twitter) separadamente.
7

Quais outras fontes você quer usar?

O assistente pode buscar conteúdo de diversas fontes para montar o roteiro do carrossel.

Links de artigos / notícias (você cola a URL) PDFs e relatórios (você envia o arquivo) YouTube (você cola o link do vídeo) Texto livre (você digita o resumo) Pesquisa automática na web pelo tema

🖼️ Badge e Identidade Visual

8

Vai usar Badge de Identificação nos slides?

O badge é a sua "assinatura visual" — aparece no topo de cada slide de conteúdo com sua foto de perfil, nome e @handle. Ajuda o leitor a identificar quem criou o carrossel enquanto está passando os slides.

badge-black.png
Versão escura
Para slides de fundo branco
badge-white.png
Versão clara
Para slides de fundo preto (capa + CTA)
📐 Requisitos do arquivo:
  • ✅ Formato PNG com fundo transparente (não JPG — JPG não tem transparência)
  • ✅ Tamanho mínimo: 400×80px (formato horizontal/wide)
  • ✅ Conteúdo: foto circular + nome + @handle lado a lado
  • ✅ Pode exportar do Figma, Canva (PNG com fundo transparente) ou Photoshop
Sim — vou enviar meus 2 PNGs Sim — quero que a IA gere automaticamente Não por agora — usar badge genérico

🔑 API de Geração de Imagens

9

Você usa o 1Password como gerenciador de senhas?

O 1Password é um cofre digital que guarda suas senhas e chaves de API com segurança. Se você já o usa, o skill pode buscar suas credenciais diretamente de lá — sem você precisar colar a chave toda vez e sem ela ficar exposta em arquivos de texto.

✅ Com 1Password

As chaves ficam no cofre do 1Password. O assistente usa op read para buscar automaticamente — zero exposição, zero digitação.

Ideal para quem já usa e preza por segurança máxima.
📄 Sem 1Password

As chaves ficam salvas em variável de ambiente local (.env) ou no config.json da skill. Simples de configurar, funciona normalmente.

Adequado para uso pessoal em máquina própria.
Sim — uso 1Password (informar vault name) Não — prefiro usar variável de ambiente (.env) Não sei / não uso gerenciador de senhas
ℹ️ Não usa nenhum gerenciador? Tudo bem — o assistente vai pedir a API Key uma vez e salvar em arquivo local protegido. Você não precisará digitar novamente.
10

Configure sua API do Google Gemini (Imagen 3)

As imagens dos carrosseis são geradas pelo Google Imagen 3 — o modelo de imagem mais avançado disponível atualmente. Não recomendamos outros providers (Midjourney, DALL-E, etc.) pois o estilo e qualidade foram otimizados especificamente para o Imagen 3.

Como obter sua API Key gratuita:
  1. Acesse aistudio.google.com
  2. Faça login com sua conta Google
  3. Clique em "Get API Key" no menu lateral
  4. Clique em "Create API Key"
  5. Copie a chave gerada e cole aqui no assistente
💰 Custo: tier gratuito disponível com limites diários. Para uso intenso (~50+ carrosseis/mês), o custo é de aproximadamente $0,04 por imagem gerada.
🔐 A chave é salva com segurança no seu ambiente local — nunca compartilhada

📦 Entrega e Armazenamento

11

Onde quer receber os slides prontos?

Após o render, o assistente envia os PNGs prontos para onde você preferir.

Telegram (informar Chat ID) WhatsApp Só salvar na pasta local
12

Quer arquivar os carrosseis no Google Drive?

Se sim, cada carrossel é salvo automaticamente em uma pasta organizada por data e tema. Útil para manter histórico e acessar de qualquer dispositivo.

Sim — informar ID da pasta no Drive Não por agora
Se escolher "Sim": o assistente vai guiar a configuração do Google Drive separadamente.

🤖 Modo de Operação

13

Prefere controlar o processo ou receber tudo automático?

Define se o assistente vai pedir sua aprovação antes de avançar, ou vai entregar o carrossel completo sem interrupções.

Autônomo — entrega sem me perguntar Semi-autônomo — quero aprovar o ângulo e o CTA antes de gerar
💡 Recomendamos começar no modo semi-autônomo para validar o estilo antes de automatizar completamente.
✅ Pronto! Configuração salva.

Agora é só dizer: "Cria um carrossel sobre [seu tema]" e o assistente cuida do resto. Para mudar qualquer configuração depois, use /carrossel-setup.

💸 Quanto vai custar?

Estimativa por carrossel completo (10 slides + 5–6 imagens geradas):

~R$2
Por carrossel completo
~R$60
30 carrosseis/mês
75%
Do custo = imagens

💡 Para reduzir custo: usar menos imagens contextuais (3 em vez de 5–6 por carrossel) reduz para ~R$1,20 por carrossel.

3

Badge do perfil — 2 versões obrigatórias

O badge aparece no topo de todos os slides de texto. Como os slides têm fundos diferentes, são necessárias duas versões:

badge-black.png
Texto escuro
Usado nos slides de fundo branco (texto_cheio e texto_curto_imagem)
badge-white.png
Texto claro
Usado na capa e no slide CTA (capa e cta_preto)
📐 Requisitos técnicos do PNG:
  • ✅ Fundo transparente (alpha channel) — nunca fundo branco ou preto
  • ✅ Resolução mínima: 400×80px (horizontal, formato wide)
  • ✅ Conteúdo: foto de perfil (circular) + nome + @handle
  • ✅ Exportar do Figma, Canva ou Photoshop em PNG-24 com transparência
  • ❌ Nunca JPG (não suporta transparência)
📎 Upload de 2 arquivos PNG: badge-black.png + badge-white.png — ou gerar automaticamente
Upload meus 2 PNGs Gerar automaticamente com IA
4

Nicho / Tema principal

Define o vocabulário, referências e exemplos que o COPYWRITER vai usar nos roteiros.

Cripto / DeFi Finanças pessoais Negócios / Empreendedorismo Tecnologia / IA Marketing Outro (descrever)
5

Tom de voz

Influencia o estilo de escrita dos slides, ganchos e CTAs.

Provocador / Direto Educativo / Didático Técnico / Analítico Informal / Próximo Formal / Institucional
6

Idioma

Português BR English Español

🔑 APIs e Integrações

7

API Key — Nano Banana Pro (Google AI Studio)

Usada para gerar todas as imagens (capas + imagens contextuais) via Google Imagen 3.
Obter em: aistudio.google.com → API Keys — tier gratuito disponível com limites diários.

🔐 Salvo no 1Password vault ou variável de ambiente GEMINI_API_KEY
8

Google Drive (opcional)

Faz upload automático de todos os arquivos do carrossel (PNGs + legendas.txt) em uma pasta organizada por data/tema.

📂 ID da pasta Drive (opcional) — ou desativar
Ativar (informar ID da pasta) Desativar
9

Canal de entrega

Onde os slides renderizados serão enviados após o render.

Telegram (informar chat ID + topic ID) WhatsApp Só salvar localmente

🤖 Modo de Operação

10

Autonomia do fluxo

Define se o assistente pede aprovação antes de avançar, ou entrega sem interrupções.

Autônomo total — entrega sem perguntar Semi-autônomo — pausa para aprovar ângulo + CTA

🤖 Modos de Operação

🚀

Modo Autônomo

Padrão
  • ✅ Pesquisa a fonte automaticamente
  • ✅ Escolhe o ângulo mais forte
  • ✅ Define o CTA contextualizado
  • ✅ Gera roteiro + capas + imagens
  • ✅ Renderiza + envia + faz upload
  • ✅ Zero interrupções do usuário

Ideal para quem quer produção em escala sem precisar revisar cada passo.

⏸️

Modo Semi-Autônomo

Controle total
  • ✅ Pesquisa a fonte automaticamente
  • ⏸️ Propõe 3 ângulos → aguarda escolha
  • ⏸️ Propõe CTA → aguarda confirmação
  • ✅ Gera roteiro + capas + imagens
  • ✅ Renderiza + envia + faz upload

Ideal para quem quer controle editorial sobre o ângulo e mensagem do carrossel.

🏗️ Arquitetura — Agente Único

✅ Agente único — sem dependências externas

O CarrosselAI funciona com qualquer assistente OpenClaw padrão. Não requer configuração de múltiplos agentes, sessões paralelas ou sub-agentes especializados. Tudo roda sequencialmente na mesma sessão, usando as ferramentas nativas do OpenClaw.

🔧

Ferramentas utilizadas

  • web_search / web_fetch — pesquisa
  • exec — gerar imagens + render
  • write / read — arquivos
  • message — entregar slides
  • 🔑 Nano Banana Pro (Imagen 3) via API key
  • 📂 Google Drive via gogcli (opcional)

Compatibilidade

  • ✅ Qualquer OpenClaw padrão
  • ✅ Sem configuração de multi-agente
  • ✅ Sem agents.json personalizado
  • ✅ Sem sessions_spawn ou sub-agentes
  • ✅ Node.js + Puppeteer no host
  • ✅ API key Google AI Studio (gratuita)

🔄 Fluxo de Execução

O agente principal executa todos os passos sequencialmente na mesma sessão. Sem spawnar sub-agentes.

Passo 1 — Pesquisa
AGENTE PRINCIPAL
Lê fonte (URL, Twitter, PDF, texto colado) via web_search / web_fetch
Passo 2 — Ângulos
AGENTE PRINCIPAL
Propõe 3 ângulos com gatilho emocional de cada
⏸️ Pausa (Semi-Autônomo) ou decisão interna (Autônomo)
USUÁRIO
Escolhe ângulo + confirma CTA
Passo 3 — Roteiro + Legendas
AGENTE PRINCIPAL
Gera 10 slides completos + 3 variações de legenda
Passo 4 — Capas
AGENTE PRINCIPAL
Propõe 5 variações de capa com JSON completo
Passo 5 — Geração de Imagens
AGENTE PRINCIPAL
Gera capa (4:5, 2K) + imagens contextuais (3:2, 1K) via exec → Imagen 3
Passo 6 — Render + Entrega
AGENTE PRINCIPAL
Render Puppeteer (render-carousel.js) → envia slides → upload Drive (opcional)
⏱️ Tempo total estimado: ~8–12 minutos do brief à entrega (vs ~5–8 min na versão multi-agente interna). A diferença é pela execução sequencial — cada passo espera o anterior completar.

📐 Tipos de Slide

O render engine (render-carousel.js) suporta 4 layouts. O COPYWRITER escolhe o tipo correto para cada slide com base na densidade do conteúdo.

capa

Slide de Capa

Imagem full-bleed (4:5) com gradiente escuro no terço inferior, headline em amarelo neon e badge branco. Sem texto de corpo.

HEADLINE IMPACTANTE
texto_cheio

Texto Cheio

Fundo branco, badge no topo, texto grande ocupa toda a área. Usado quando há 4+ linhas de conteúdo. Sem imagem.

Texto educativo
com conteúdo denso
e dados relevantes
que precisam de espaço
texto_curto_imagem

Texto Curto + Imagem

Fundo branco, badge no topo, texto curto (até 3 linhas) + imagem contextual 3:2 embaixo com rounded corners.

Texto curto aqui
cta_preto

CTA Final

Fundo preto, badge, texto de CTA contextualizado em branco. Linha de acento vermelha acima do texto. Último slide obrigatório.

Segue pra não perder
o próximo antes do mercado.
📏 Regra de densidade: Slides com 3 linhas ou menos → texto_curto_imagem. Slides com 4+ linhas → texto_cheio, sem imagem. Prioridade: legibilidade.

🎨 Tipos de Capa

10 tipos catalogados no banco-capas. O DESIGNER escolhe o tipo que melhor amplifica o gatilho emocional do ângulo. Cada variação de capa entregue com JSON completo pronto para gerar via Imagen 3.

HEADLINE EM CAIXA ALTA
Tipo 1

Cenário Macro

Vista ampla de cidade, economia, sistemas. Escala + impotência.

HEADLINE URGENTE
Tipo 2

Crise / Colapso

Gráficos caindo, destruição sistêmica. Urgência e medo.

HEADLINE REVELAÇÃO
Tipo 3

Revelação / Oportunidade

Luz no fundo do túnel. Epifania. Dado oculto revelado.

CONSPIRAÇÃO
Tipo 4

Conspiração / Sistema

Sombras, poder oculto, redes de controle. Desconfiança.

DADO: $1.000.000
Tipo 5

Dado Âncora

Número impactante em destaque absoluto. Choque de escala.

LINHA DO TEMPO
Tipo 6

Vista Aérea / Infraestrutura

Fotografia aérea noturna. Escala física impressionante.

VS
Tipo 7

Confronto / Versus

Dois lados em conflito. Força vs fraqueza. Antes vs depois.

SILHUETA
Tipo 8

Silhueta / Identidade

Figura humana + contexto simbólico. Protagonismo do leitor.

MACRO + DETALHE
Tipo 9

Objeto Simbólico

Objeto único em closeup extremo. Metáfora condensada.

MATRIX DATA
Tipo 10

Dado / Visualização

Gráfico, chart ou fluxo como arte. Dados viram estética.

🖼️ Imagens Contextuais

Imagens geradas para os slides do tipo texto_curto_imagem. Aparecem abaixo do texto, com rounded corners e padding lateral.

📐

Formato: 3:2 Landscape

Container do slide é 956×650px (proporção 3:2). Imagens devem ser geradas em --aspect-ratio 3:2. Usar 1:1 gera espaço morto e crop errado.

🎯

Composição Tight

O elemento principal deve ocupar 70-80% do frame. Zero espaço morto ao redor. Sujeito próximo às bordas do frame.

🚫

Sem Gradiente Escuro

Gradiente de fade para preto é regra exclusiva da capa. Imagens contextuais têm fundo limpo — nunca degradê escuro nas bordas.

🎨

Conceitual e Metafórica

Cada slide recebe uma imagem exclusiva baseada no gatilho emocional daquele slide. Nunca reutilizar a capa ou outra imagem contextual.

⚙️ Render Engine
object-fit: cover + object-position: center center + background: #FFFFFF + border-radius: 16px
Não alterar esses parâmetros — validados após múltiplas iterações.

📣 Tipos de CTA

O CTA sempre aparece no último slide (cta_preto). Deve ser contextualizado com a narrativa do carrossel — nunca genérico.

🚨

CTA Urgência

Sensação de que o momento é agora. Usado quando o carrossel revela uma janela de oportunidade ou ameaça iminente.

"Isso vai mudar nos próximos 90 dias.
Segue pra estar por dentro antes."
🔮

CTA Revelação / FOMO

O leitor sente que descobriu algo que poucos sabem. Medo de ficar de fora do próximo conteúdo importante.

"O próximo padrão já está se formando.
Segue aqui pra não perder."
🎓

CTA Educativo

Posiciona o criador como professor. Quem segue vai aprender antes dos outros e tomar decisões melhores.

"Quem entendeu isso em 2020 saiu na frente.
Me segue pra entender o que vem agora."
🪞

CTA Identificação

O leitor se vê na situação descrita. CTA convida para continuar a jornada junto.

"Se você ainda não sabia disso,
aqui é o lugar certo pra começar."
❌ CTA Proibido: "Segue o perfil e compartilha" / "@handle" como linha isolada / mencionar nome de produto ou comunidade como entidade. O CTA promove SEMPRE o perfil pessoal do criador.

💰 Custo por Carrossel

Estimativa baseada em carrossel completo: 10 slides + capa + 5–6 imagens contextuais + 3 legendas.

ItemModelo/APIQtdCusto Unit.Subtotal
Capa (4:5, 2K)Imagen 31~$0,04~$0,04
Imagens contextuais (3:2, 1K)Imagen 35-6~$0,04~$0,20-0,24
COPYWRITER (roteiro + legendas)Claude Haiku~30k tokens-~$0,01
NERD (pesquisa)Claude Haiku~10k tokens-~$0,005
DESIGNER (coordenação)Gemini Flash~8k tokens-<$0,01
DEV (render + entrega)Claude Haiku~5k tokens-~$0,005
Render (Puppeteer local)$0
Drive / Telegram$0
Total estimado por carrossel
~75% do custo = geração de imagens
~$0,30–0,45
≈ R$1,75–2,60 BRL

💡 Para reduzir custo: gerar 3 imagens contextuais em vez de 5-6 → cai para ~$0,20 por carrossel.

📋 Regras Permanentes

✅ Correto

Imagens contextuais em 3:2 landscape

❌ Proibido

Imagens contextuais em 1:1 ou 4:5

✅ Correto

Elemento principal ocupa 70-80% do frame

❌ Proibido

Sujeito pequeno com fundo vazio ao redor

✅ Correto

Gradiente escuro exclusivo na capa

❌ Proibido

Gradiente/fade preto em imagem contextual

✅ Correto

Slides 4+ linhas → texto_cheio

❌ Proibido

Slides densos como texto_curto_imagem

✅ Correto

CTA contextualizado com o tema do carrossel

❌ Proibido

"Segue o perfil e compartilha" (genérico)

✅ Correto

\n entre parágrafos ou bullets distintos

❌ Proibido

Traços (—) em qualquer campo de texto

✅ Correto

Cada slide curto tem imagem exclusiva

❌ Proibido

Reutilizar a capa ou outra imagem contextual

✅ Correto

Fear & Greed como dado de suporte máx 1x

❌ Proibido

F&G como ângulo central do carrossel

🗺️ Roadmap

FaseDescriçãoStatus
v1.0Engine completo: pesquisa → roteiro → imagens → render → entrega Telegram + DriveAtivo
v1.1Setup wizard interativo no primeiro boot (config.json automático)Em desenvolvimento
v1.2Geração automática de badge para quem não tiver PNG próprioPlanejado
v2.0Postagem automática no Instagram via Graph API (imediata ou agendada com data/hora BRT)Roadmap
v2.1Analytics pós-postagem: métricas de alcance, engajamento, salvamentos, compartilhamentosRoadmap
v3.0Multi-idioma nativo (EN + ES) com banco de capas localizadoRoadmap

💡 Sugestões de Evolução Pós-Validação

Após validar o processo com pelo menos 10 carrosseis entregues, recomenda-se avaliar as expansões abaixo:

📡

Fonte de Conteúdo Automatizada

Vincular uma fonte de dados recorrente (newsletter, RSS, conta do Twitter/X, canal do YouTube) para que o skill monitore automaticamente e dispare a produção de um carrossel quando detectar conteúdo relevante.

Fontes suportadas: Twitter/X via bird CLI · RSS feeds · YouTube (transcrição automática) · newsletters por e-mail · PDFs de relatórios
v3.1 — Roadmap
📲

Postagem Automática no Instagram

Após render e aprovação (ou em modo totalmente autônomo), o skill posta o carrossel diretamente no Instagram via Meta Graph API — com legenda, hashtags e agendamento de horário.

Funcionalidades: Postagem imediata ou agendada · Seleção de legenda (1 de 3 variações) · Hashtags automáticas por nicho · Relatório de publicação
v2.0 — Roadmap Requer: Meta App + permissão instagram_content_publish