Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: o TikTok e outras redes similares estão sendo lotados de deepfakes de médicos reais vendendo um suplemento "milagroso" para a menopausa. #cuidadocomofakedrauzio

No AiDrop de hoje, repetindo a palavra IA trocentas vezes:

• OpenAI: 10 anos da startup privada mais valiosa do mundo
• IA: genial no código, perdida no cupom
• Doppl: o Google nas comprinhas
• IA por aí: Z.ai, Alibaba, OpenAI e mais…
• Me explique como se eu fosse uma criança: Grounding

STARTUPS

10 anos de OpenAI

Em 2015, a inteligência artificial ainda não vencia humanos no Go e aprendia a jogar Mario usando só um botão. Foi nesse cenário que a OpenAI surgiu em San Francisco com a missão quase ingênua de “construir uma AGI segura para beneficiar a humanidade”. Pra isso, os 11 cofundadores tinham ~US$ 1 bilhão em mãos.

Dez anos depois, apenas 3 dos 11 continuam na OAI, que se tornou a maior startup privada da história, avaliada em US$ 500 bilhões e somando avanços brutais no setor.

  • 2016 – OpenAI Gym: lançou o kit que virou padrão da indústria pra medir aprendizado por reforço.

  • 2019 – OpenAI Five: treinou bots de Dota 2 jogando “anos por dia” e conseguiu vencer campeões mundiais.

  • 2019 – GPT-2: lançou uma IA capaz de gerar textos, saindo do laboratório e entrando no debate público.

  • 2020 – GPT-3: evoluiu o modelo permitindo que exemplos de prompt sejam transformados em material real – e a API é transformada em produto.

  • 2021 – DALL-E e Codex: divulgou o primeiro modelo de imagem da empresa; GPT-3 também virou um assistente de coding na primeira versão do Codex.

  • 2022 – ChatGPT 3.5: o que era para ser uma prévia virou o produto de crescimento mais rápido da história: 100 milhões de usuários em 2 meses.

  • 2023–2024 – GPT-4, Sora, o1: salto em raciocínio, multimodalidade e modelos que "param pra pensar”.

  • 2025 – GPT-5 e a Era dos Agentes: a OpenAI produz uma IA que deixa de ser só chat e começa a executar fluxos inteiros conectados a sistemas reais.

  • Fim de 2025 — Com fins lucrativos: a empresa que antes soava ingênua, agora possui uma vertente com fins lucrativos e busca ainda mais financiamento e poder de processamento para atingir seus objetivos.

De 2022 até o início deste ano, a OpenAI nadava de braçada – 800 milhões de usuários ativos e zero concorrentes reais no retrovisor. Mas o Google acordou, turbinou o Gemini e botou pressão suficiente pra deixar Sam Altman em “Code Red”.

Enquanto isso, DeepSeek e Alibaba esticam os limites na China, a Anthropic vira a queridinha do setor corporativo e os modelos menores conquistam nichos comendo pelas beiradas. A OpenAI moldou o mercado – mas agora precisa suar pra continuar mandando nele.

IA POR AÍ
  • OpenAI recuou com a estratégia de colocar anúncios nas respostas após reclamações dos usuários pagantes.

  • Z.ai lançou seu modelo multimodal GLM-4.6V nas versões 106B e 9B; o menor você pode rodar localmente ou via API de graça.

  • Alibaba apresentou um modelo de IA chamado Live Avatar, onde é possível rodar um agente de IA conversacional em vídeo por até 10 mil segundos.

  • Google anunciou que irá vender seus óculos de IA em 2026, competindo diretamente com o Rayban Meta.

  • Mistral lançou o Devstral 2 e Devstral Small 2, com o maior tendo performance similar ao Grok Code Fast 1 e Kimi K2 Thinking; também lançou o Mistral CLI.

Agora o Replit permite utilizar MCPs (que passam informações entre aplicativos) dentro de apps e libera, por exemplo, criar apps com os seus conteúdos de dentro do Notion.

Para adicionar seus próprios MCPs, basta acessar a página de integrações e conectá-los.

Se você se interessa pelo assunto, confira uma biblioteca vasta de MCPs →

MODELOS

Genial no código, perdida no cupom

A corrida da IA pode ter muitos testes de performance em vestibulares, olimpíadas e competições de programação, mas a maioria das IAs falha quando alguém pede para "indicar um notebook barato e bom". Tentando descobrir como metrificar essas falhas, a Mercor criou o ACE, um benchmark dedicado às tarefas do dia a dia.

O benchmark tem 400 tarefas do dia a dia, divididas em quatro áreas: compras, comida, DIY (faça-você-mesmo) e games. Tudo foi construído por 47 especialistas humanos (chefs, gamers, personal shoppers, engenheiros), com critérios objetivos. O topo da tabela ficou concentrado nos modelos da OpenAI:

  • Modelos testados: Gemini 2.5 Flash e Pro, Gemini 3 Pro, GPT-5, GPT 5.1, o3, o3 Pro, Claude Opus 4.1, 4.5 e Sonnet 4.5 – todos com raciocínio no máximo.

  • Comida: GPT-5 chegou a 70,1% de acerto em planos de refeição, receitas simples e improviso com ingredientes limitados.

  • Games: o3 Pro bateu 61,3% em recomendações de jogos, estratégias e explicação de táticas – o segundo colocado foi o GPT 5.1.

  • DIY: para tarefas de reparo ou execução em casa com assistência da IA, o GPT 5.1 teve o melhor resultado com 55,8%.

  • Compras: o modelo o3 Pro se saiu melhor com 45,4%, com o GPT-5.1 ficando empatado em segundo com o o3 base, com 44,7%.

Quando o assunto é cupom, frete e boleto, a IA fica no nível “vídeo-cassetadas”. No domínio de compras, um dos maiores problemas era alucinar informações:

  • Modelos deram links quebrados ou inexistentes em recomendações de produtos e jogos.

  • Em vários casos, inventaram preços que não batiam com as páginas que eles mesmos usaram como fonte.

  • Em critérios de compatibilidade (tipo “essa peça serve no meu PC?”), os erros foram frequentes.

  • Alguns modelos caíram mais de 20 pontos percentuais quando o benchmark passou a exigir que tudo fosse comprovado nas fontes (grounding).

O pulo do gato do ACE é justamente verificar se o que o modelo disse batia com o que estava na web, que ele usou de referência. Quando solicitada uma prova com link/fonte os preços, fichas técnicas e compatibilidade, mostrou que só falavam bonito, mas davam péssimos resultados da busca.

A equipe ainda rodou oito vezes cada caso, somando mais de 220 mil avaliações de critérios, e encontrou uma variação alta entre execuções – o que explica por que às vezes a IA acerta em cheio e, duas mensagens depois, alucina completamente.

O AI Consumer Index (ACE) é um balde de água fria necessário: mostra que a IA já é ótima como assistente geral, mas ainda é um péssimo personal shopper confiável. Cada IA tem uma habilidade diferente, e, aparentemente, o ChatGPT pode ser a melhor para tarefas do dia a dia, enquanto Claude e Gemini são boas para código… e por aí vai.

ME EXPLIQUE COMO SE EU FOSSE UMA CRIANÇA

Grounding | Deixando a IA “pé no chão”

O termo se refere a “ancorar” a IA na realidade. Em vez de só chutar com base em textos antigos, ela puxa dados reais na hora. Pode ser de bancos de dados, documentos, APIs, planilhas, internet, o que você conectar.

Isso reduz as “alucinações” (quando a IA inventa informações) e deixa as respostas mais confiáveis. É como alguém que não responde só de cabeça, mas confere no sistema antes de te responder.

E-COMMERCE

Google nas comprinhas

O Google perdeu a Black Friday, mas chegou em tempo de ver os estoques sendo refeitos para o Natal e relançou o Doppl - uma ferramenta para auxiliar na busca de roupas criando um provador virtual -, integrando o novo Nano Banana, Veo e alguns recursos a mais para personalizar a experiência com muita IA:

  • Você envia uma foto sua ou escolhe um avatar;

  • Seleciona peças de roupa do catálogo ou de screenshots da sua galeria;

  • O app gera imagens realistas vestindo o look;

  • Em seguida, o app pode transformar imagens estáticas em vídeos curtos, mostrando o caimento da roupa e movimento no seu corpo virtual.

O feed tem uma área de vídeos verticais de até 15 segundos no modo “descoberta/for you”, feita pra você compartilhar suas gerações e espiar ideias de looks afinadas com o seu gosto. É basicamente um Pinterest fashion com esteroides algoritmo no modo turbo.

Um ano atrás pensar num feed só de IA podia parecer esquisito, mas a ideia já tá pegando. Além do Doppl, o Sora 2 também já tentou criar um "TikTok de IA" e a Meta fez o mesmo com o Vibes.

Enquanto essas duas ferramentas já são globais, a do Google ainda está limitada aos EUA.

Embora não seja um app pensado para ajustar tamanho, tecido ou fidelidade visual, ele deve virar peça de um projeto maior: ajudar a reduzir devoluções de quem “não recebeu o que esperava” – um dos grandes calos de e-commerces e marketplaces.

Ao mesmo tempo, ele deve se juntar a soluções de compras já lançadas por OpenAI e Perplexity para unir consumidores e vendedores em ambientes que vão muito além do tradicional ciclo “busca de produtos → dúvida → busca de reviews → mais dúvida → compra”.

CAIXA DE FERRAMENTAS

Você é uma pessoa muito visual que gosta de utilizar canvas infinitos, quadros brancos para anotação e coisas do tipo? Tenho certeza que vai se interessar pela nova ferramenta gratuita do Google: Mixboard!

  • Acesse com sua conta do Google;

  • Crie um novo projeto ou entre em algum pronto para experimentar;

  • Digite um prompt na barra inferior, por exemplo: “Monte um moodboard com a estética de Art Deco” ou “tigre comendo pão de queijo” e ele irá gerar fotos/imagens do tema;

  • Transforme suas criações selecionando múltiplas imagens e colocando outros prompts e criando um super mix criativo ou realista dos estilos que quiser mesclar.

Confira todas as ferramentas que nós separamos na cAIxa de ferramentas do AiDrop!

MEME DA SEMANA

O que achou da edição de hoje?

Login or Subscribe to participate

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau às assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

0 comments

or to participate

Veja as edições anteriores

No posts found