87,6% dos bugs resolvidos sem você tocar no código. Os agentes chegaram pra valer.
Três posts publicados essa semana, todos descendo um nível em relação ao comparativo da semana passada. Depois de mapear as ferramentas, foi hora de entender o que tá por baixo. Como agentes de IA realmente funcionam por dentro, o que o GitHub Copilot acabou de mudar (com a nova cobrança por crédito que entra mês que vem) e como o Lovable virou a porta de entrada mais simples pra construir app sem código.
Main Install
Agentes de IA para programação: o que são, como funcionam e quais usar em 2026
A indústria saiu de "IA que completa a próxima linha" pra "IA que recebe uma tarefa, planeja, edita múltiplos arquivos, roda testes e abre PR" em menos de dois anos. O post desmonta o que tá por baixo desse salto. Um agente não é autocomplete sofisticado, é um sistema com ciclo de trabalho próprio: lê o repositório, entende a arquitetura, planeja, executa, verifica e itera até passar.
Os números do SWE-bench (o benchmark que mede capacidade real de resolver issues de engenharia) deixam o ranking claro. Claude Code 87,6%, Codex 71,0%, Cursor 67,2%, Devin 60,8%. A diferença não é cosmética, é a fronteira entre "agente que entrega" e "agente que precisa ser babá".
A arquitetura por trás de todos eles é a mesma: modelo de linguagem como cérebro (Opus 4.7, GPT-5, Gemini), ferramentas que dão acesso ao mundo real (sistema de arquivos, terminal, APIs, MCP servers), contexto via janela grande ou RAG, e loop de verificação que separa código que funciona de código que parece funcionar. O Claude Code segue o ciclo Plan-Execute-Verify-Report. Outros agentes variam, mas o esqueleto é parecido.
A parte que importa pra quem vai escolher: cada agente tem um nicho. Claude Code lidera em profundidade (refatoração pesada, debug complexo, multi-arquivo). Copilot Coding Agent ganha na integração nativa do GitHub (issue vira PR sem sair do navegador). Cursor brilha em background dentro do editor visual. Codex roda em cloud assíncrono. Devin opera como "engenheiro autônomo" e caiu de US$ 500 pra US$ 20 por mês em 2025.
A regra prática do post pra saber quando usar agente: se você consegue descrever a tarefa com clareza suficiente pra um dev júnior competente executar sem perguntar nada, um agente provavelmente também consegue. Se exige discussão, alinhamento ou julgamento de produto, faça você mesmo.
Quick Patches
GitHub Copilot em 2026: o que mudou (e por que mês que vem você vai precisar prestar atenção na fatura)
O Copilot deixou de ser autocomplete. Hoje tem quatro camadas: tab completion (ainda gratuito e ilimitado em todos os planos, isso é importante), chat inline, agent mode pra edição autônoma de múltiplos arquivos, e o coding agent que pega issue do GitHub e devolve PR sem você abrir o editor. Mais o GitHub Spark pra vibe coding e o Agentic Code Review que automatiza revisão de PR. A bomba do post é a mudança de billing: a partir de junho de 2026, todos os planos migram pra cobrança baseada em uso com AI Credits. Pro inclui US$ 10 em créditos, Pro+ inclui US$ 39, Business US$ 19 por seat. Modelos caros (Opus, GPT-5) consomem mais. Quem usa agent mode pesado vai sentir.
Lovable: tutorial completo pra criar apps com IA sem escrever código
O Lovable virou a porta de entrada mais limpa pra vibe coding full-stack. Três modos: Agent Mode (autônomo, explora codebase e resolve tarefa inteira sozinho), Chat Mode (conversa com aprovação passo a passo) e Visual Edits (edita direto na preview). A integração com Supabase é o diferencial real: banco PostgreSQL, autenticação, storage, edge functions e Row Level Security configurados via prompt em português, sem SQL escrito à mão. O sync com GitHub é bidirecional, então código gerado lá aparece no seu repo e mudanças no repo voltam pra plataforma. Plano Free 30 créditos por mês, Starter US$ 25, Pro US$ 50, Teams US$ 100 por seat. Founder não-técnico valida MVP em fim de semana por menos de R$ 150.
Toolkit
Bolt.new - a alternativa quando você quer mais controle sobre o stack
Se Lovable é a porta de entrada mais polida, Bolt.new é a alternativa pra quem quer mexer mais embaixo do capô. Roda no browser via WebContainers (sem depender de servidor externo), suporta React, Next.js, Vue, Svelte e Astro, e dá velocidade bruta de geração que poucas plataformas igualam.
A diferença prática: Lovable é opinativo (você fica no caminho que ele otimiza). Bolt.new é flexível (você escolhe o stack). Pra protótipo rápido com framework específico ou quem prefere ter controle sobre cada decisão técnica, Bolt entrega mais. Pra app full-stack com Supabase integrado e visual polido sem esforço, Lovable continua na frente.
O tutorial cobre passo a passo: do prompt inicial ao deploy, com integração de banco e ajustes via conversa. Combinado com Lovable e V0, completa o trio de vibe coding que usamos no dia a dia da Marfin.
Field Note
Exit
A pergunta não é mais "vai dar certo". É "quanto você ainda vai esperar". Semana que vem tem mais.
Ivan.
Perdeu alguma edição? Visita o arquivo da newsletter e revê edições anteriores.