Sem acesso livre, OpenAI corre contra o temido “colapso do modelo”
OpenAI – seguida por Google e Meta – enfrenta, em 2026, a conta salgada de um bloqueio global de dados. Sites de notícias, fóruns e bancos de imagens ergueram barreiras contra rastreadores de IA, convertendo cada parágrafo em ativo negociável.
- Em resumo: contratos já superam US$ 400 milhões e viraram única saída para manter a qualidade dos modelos.
Jornais erguem muro digital e viram fonte de receita inédita
Levantamento do Reuters Institute mostra que 48 % dos principais portais bloqueiam GPTBot e CCBot, número que salta para 79 % entre os veículos líderes. A News Corp faturou US$ 250 milhões da OpenAI, enquanto o TechCrunch detalha o acordo de US$ 60 milhões/ano entre Google e Reddit, hoje referência para negociações futuras.
“Quando uma IA é treinada com dados gerados por outras IAs, a qualidade degrada de forma exponencial em poucas gerações”, alertam pesquisadores de Oxford e Cambridge sobre o chamado Model Collapse.
Escassez de dados pressiona hardware e métodos de treinamento
Com o custo de aquisição de dados chegando a 30 % do orçamento, Big Techs investem em GPUs Nvidia H100 e em técnicas de pruning e quantização para extrair “inteligência por byte”. Analistas apontam que a nova economia pode acelerar chips especializados, como os TPUs da Alphabet, e abrir espaço para provedores que ofereçam datasets curados de alta qualidade.
O que você acha? A era de dados gratuitos acabou ou veremos novas formas de compartilhamento? Para mais análises de tecnologia, acesse nossa editoria especializada.
Crédito da imagem: Divulgação / Reuters