Runnable: o agente de IA que escreve, executa e publica código sozinho — como funciona, casos de uso e preços

Runnable é a nova geração de agentes que vão além do chat: rodam código em sandbox, testam, corrigem erros e fazem deploy. Veja o que ele faz hoje, limitações, integrações e quanto custa.
O que é o Runnable
Runnable é uma nova geração de agentes de IA que vai além do 'chat que gera código'. Ele recebe uma tarefa em linguagem natural, escreve o código, executa em um ambiente sandbox isolado, observa o resultado, corrige erros automaticamente e, quando tudo passa nos testes, faz o deploy.
Em vez de você ser o intermediário entre 'pedir' e 'rodar', o Runnable fecha o loop completo: planejar → escrever → executar → debugar → entregar. É o que se costuma chamar de 'agente full-stack autônomo'.
Como funciona por dentro
1. Planner: um LLM grande quebra a tarefa em subtarefas (ex.: 'criar API REST de tarefas' vira: definir schema, escrever rotas, criar testes, subir banco, publicar).
2. Coder: gera os arquivos seguindo padrões do projeto, lendo o repositório existente quando há um.
3. Executor: roda o código em um container Linux efêmero com Node, Python, banco e ferramentas comuns pré-instalados.
4. Critic: lê logs, testes e respostas HTTP. Detecta falhas e devolve para o Coder corrigir, iterando até passar.
5. Publisher: faz commit, abre PR, dispara CI e/ou faz deploy em provedor cloud configurado (Vercel, Cloudflare, AWS).
Para que serve na prática
Automação de tarefas técnicas repetitivas: gerar relatórios a partir de várias APIs, processar lotes de arquivos, raspar dados de sites, criar pipelines de ETL.
Refatorar e modernizar código legado (migrar de uma lib para outra em centenas de arquivos, com testes).
Criar pequenos serviços/microsserviços do zero: 'crie uma API que recebe um CSV, valida CPF e devolve um JSON' — em minutos, com deploy.
QA assistido: rodar testes E2E em paralelo em vários cenários, gerar relatório de cobertura, abrir issues automaticamente.
Análise de dados ad-hoc: pegar um conjunto de planilhas, executar código Python, gerar gráficos e relatório em PDF.
Diferença para Lovable e ChatGPT
ChatGPT/Claude: ótimos para gerar trechos de código, mas você precisa copiar, colar, rodar e debugar manualmente.
Lovable: foco em aplicações web full-stack com preview ao vivo, banco e auth integrados; menos voltado para automações pontuais e scripts.
Runnable: foco em executar tarefas — scripts, jobs, refactors, automações, pequenos APIs — fechando o loop de execução. Excelente como 'engenheiro junior virtual' que roda 24/7.
Integrações típicas
GitHub/GitLab/Bitbucket para clonar e abrir PRs.
Provedores cloud (Vercel, Cloudflare Workers, AWS Lambda, Fly.io) para deploy.
Bancos gerenciados (Supabase, Neon, PlanetScale) via variáveis de ambiente.
Observabilidade (Sentry, Logflare) para o Critic observar erros em produção.
Slack/Discord para reportar status das tarefas.
Planos e custos (referência 2026)
Agentes que executam código têm dois custos somados: assinatura da plataforma + uso de compute (CPU/memória/tempo de execução) + tokens de LLM.
Planos free típicos: poucas horas de execução por mês e tarefas pequenas.
Planos pro: US$ 20–50/mês com 20–100 horas de compute e janela maior de contexto.
Planos team/enterprise: US$ 100–500+/mês com execução paralela, controle de acesso, logs auditados e SLA.
| Plano | Faixa de preço | Compute incluso | Para quem |
|---|---|---|---|
| Free | US$ 0 | ~2h/mês | Experimentar |
| Pro | US$ 20–50/mês | 20–100h | Dev solo / automações pessoais |
| Team | US$ 100–300/mês | 200–500h | Times de engenharia |
| Enterprise | Sob consulta | Custom | Operação em escala |
Pontos fortes e limites
Fortes: roda código de verdade, fecha o loop sozinho, ótimo para tarefas com critério de sucesso claro (passou no teste, retornou 200, gerou o relatório).
Limites: tarefas muito ambíguas ou sem teste objetivo o agente costuma 'travar em loop' e consumir compute. Vale revisar PRs antes de mergear em produção. Custo escala rápido se você deixar o agente livre sem limite.
Quando vale a pena
Automatizar tarefas técnicas que se repetem semanalmente; criar microsserviços e jobs; refatorar bases médias com cobertura de teste; gerar relatórios complexos; rodar QA. NÃO substitui um time de produto/UX, e ainda precisa de revisão humana para mudanças críticas.
Quer aplicar isso na sua empresa?
Fale com a Koda Digital e receba um plano sob medida.
Falar no WhatsApp