A "Taxa por Token" do GitHub Copilot — O Modelo que Pode Quebrar a Cultura Open-Source
Você abriu o VS Code cedo, rodou uma sessão pesada de refactoring com o Copilot, e no fim do mês a conta veio: R$ 3.750. O mês anterior tinha sido R$ 145. Mesmos projetos, mesmos workflows, mesma output.
Isso é exatamente o que começou a acontecer para parte dos desenvolvedores quando, em 1º de junho de 2026, o GitHub ativou cobrança baseada em tokens para todos os planos do Copilot.
A reação no Reddit, no Hacker News e no X foi imediata e furiosa. A frase "que piada" virou o slogan não oficial da revolta dos desenvolvedores. Um dev compartilhou a projeção: US$ 29 por mês no modelo antigo. Uma estimativa de US$ 750 por mês com a cobrança por token — nos mesmos fluxos de trabalho, nos mesmos projetos, na mesma entrega. Outro desenvolvedor no plano Pro+ reportou ter consumido 8% de toda a sua cota mensal de créditos em apenas duas horas.
O Que Mudou — e Por Quê
Por dois anos, o GitHub Copilot operou em um modelo simples: pague uma taxa mensal fixa, use à vontade. Desenvolvedores construíram workflows inteiros em torno dessa previsibilidade. Times orçaram para isso. Startups contaram com isso. Então, na virada de junho, tudo mudou.
| Modelo Anterior | Novo Modelo | |
|---|---|---|
| Cobrança | Mensal fixa | Por token consumido |
| Preço estimado (uso leve) | ~US$ 10/mês | Menor — paga só pelo que usa |
| Preço estimado (uso pesado) | ~US$ 29/mês | Projeção de até US$ 750/mês |
| Previsibilidade | Alta | Baixa |
| Transição gradual | — | Nenhuma |
| Multiplicador modelos raciocínio | — | Até 10× |
A razão técnica não é obscura. Quando um desenvolvedor roda uma sessão de refactoring usando um modelo de raciocínio pesado como o o1 via Copilot, o custo computacional real pode ser 10× ou mais do que uma mensalidade fixa jamais precificou. A Microsoft estava efetivamente subsidiando usuários pesados à custa dos leves — e na escala de milhões de desenvolvedores, esse subsídio ficou insustentável.
A Pergunta Desconfortável
E se essa mudança eliminar justamente os desenvolvedores que construíram o software que você usa hoje? O dev que acabou de receber uma projeção de US$ 750 não é uma equipe corporativa com orçamento de TI. É provavelmente um contribuidor solo mantendo uma biblioteca da qual 30.000 outros projetos dependem. É a pessoa que escreveu o pacote npm que você usou hoje de manhã. Ela vai desativar o Copilot ou abandonar os workflows de IA mais intensivos — exatamente onde a assistência de IA cria mais valor.
O risco real é de recentralização. Se as barreiras de custo empurram workflows de codificação IA complexos de volta para times com orçamento e para longe de indivíduos sem ele, corremos o risco de recentrar a inovação em software dentro de grandes corporações. Isso aconteceria não com estrondo, mas com uma fatura.
Uma fatura de US$ 750 por mês é "irritante mas gerenciável" para um engenheiro em San Francisco. No Brasil, com salários de desenvolvedor variando de R$ 3.000 a R$ 12.000 mensais antes de impostos, essa mesma fatura representa entre 25% e 100% do salário bruto. São Paulo, Recife e Porto Alegre estão produzindo algumas das mentes técnicas mais criativas do mundo — e elas podem estar prestes a ser precificadas para fora das melhores ferramentas.
O Que o Build 2026 Disse Sobre Isso
No Build 2026, a Microsoft apresentou o MAI-Code-1-Flash — modelo proprietário de codificação posicionado como mais rápido e mais barato que as opções existentes no seletor de modelos do Copilot. É a resposta direta ao backlash da cobrança. O problema: está sendo lançado gradualmente no VS Code e ainda não é substituto completo para os workflows pesados que os devs estavam rodando. "Reconheceu" e "resolveu" são coisas diferentes.
Sendo honesto: se você mal usa o Copilot, vai pagar quase nada. A mensalidade fixa era efetivamente um imposto sobre usuários leves para subsidiar os pesados. Desenvolvedores que usam Copilot apenas para autocomplete básico — a maioria — podem de fato pagar menos. O problema é que os devs construindo o software mais complexo e importante são exatamente os usuários pesados. O modelo pune o caso de uso onde a IA cria mais valor.
O Que Esperar: Curto, Médio e Longo Prazo
Agora — Q4 2026
Choque de Fluxos e Pânico de Orçamento
Times auditam consumo de tokens em pânico. Muitos devs fazem downgrade para modelos mais leves ou restringem funcionalidades de IA às tarefas mais baratas. Cursor, Windsurf e modelos locais via Ollama devem ver seus meses de maior crescimento histórico.
2027
Mercados e Inovação em Camadas
Ferramentas de codificação IA se dividem entre enterprise-grade (caras, poderosas) e indie-grade (baratas, limitadas). O gap de capacidade entre times bem financiados e desenvolvedores solo se aprofunda. Modelos open-source locais começam a parecer muito mais atrativos como estratégia de sobrevivência econômica.
2028 em diante
A Pergunta Real de Monopólio
Se GitHub, Copilot, Azure e MAI models — todos Microsoft — formarem a stack dominante do desenvolvimento de software, reguladores vão perguntar: uma empresa capturou a camada produtiva de todo o desenvolvimento de software global? A mudança de cobrança de junho pode ser o momento que os historiadores apontarão como o início dessa história.
A Dimensão Geográfica que o Debate Ignorou
Existe uma dimensão geográfica nessa discussão que o ciclo de indignação centrado nos EUA ignorou quase completamente. A comunidade global de desenvolvedores não é monolítica. Uma cobrança de US$ 750 por mês é "irritante mas gerenciável" para uma empresa em San Francisco com orçamento de TI. Para um desenvolvedor solo em São Paulo, Nairóbi ou Jacarta — cidades que produzem algumas das mentes técnicas mais criativas do mundo — essa mesma fatura é proibitiva. A exclusão não é acidental. É estrutural: os custos de inferência são denominados em dólares, mas os salários dos desenvolvedores não são.
O Medidor Está Rodando — e Não Só em Tokens
A mudança da Microsoft é defensável como decisão de negócio. A conta simplesmente não fecha com sessões de o1 a US$ 29 no fim do mês. Isso não é conspiração — é aritmética.
O que vale monitorar não é a raiva imediata — isso passa. É se esse modelo vai silenciosamente remodelar quem pode competir no desenvolvimento de software assistido por IA nos próximos cinco anos. A história da tecnologia sugere que toolchains fechados e caros produzem produtos otimizados para mercados existentes. Toolchains abertos e baratos produzem revoluções que ninguém viu vir. A cobrança por token não impede o segundo futuro — mas coloca um preço nele.
Um fato que ficou enterrado no ciclo de indignação: completions de código — o recurso que a maioria dos desenvolvedores usa todos os dias — continuam completamente gratuitos. A mudança de cobrança tem como alvo os workflows agênticos e as sessões pesadas com modelos de raciocínio, não o autocomplete. Essa nuance importa, mas não resolve o problema de equidade de acesso. O desenvolvedor em São Paulo ou Nairóbi rodando uma sessão complexa de refactoring agora enfrenta um teto que o desenvolvedor em San Francisco pode absorver como despesa de negócio. Essa assimetria não é só um problema de precificação — é uma escolha estrutural sobre quem vai construir a próxima geração de software.
Se a comunidade open-source responder redirecionando para modelos locais e inferência self-hosted, a consequência não intencional dessa mudança de cobrança pode ser acelerar a independência de IA das nuvens proprietárias mais rápido do que qualquer política poderia. A Microsoft deveria estar observando isso mais atentamente do que suas métricas de tokens.
Leia também: A Era dos Agentes de IA Chegou, O Windows Virou um Sistema Operacional para Agentes de IA e O IPO da Anthropic.
Informações baseadas nos anúncios oficiais do GitHub e Microsoft, incluindo o Build 2026 (junho de 2026). Projeções de custo são estimativas baseadas em cenários de uso relatados pela comunidade de desenvolvedores.