Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: o TikTok e outras redes similares estão sendo lotados de deepfakes de médicos reais vendendo um suplemento "milagroso" para a menopausa. #cuidadocomofakedrauzio

❝

No AiDrop de hoje, repetindo a palavra IA trocentas vezes:

• OpenAI: 10 anos da startup privada mais valiosa do mundo
• IA: genial no código, perdida no cupom
• Doppl: o Google nas comprinhas
• IA por aí: Z.ai, Alibaba, OpenAI e mais…
• Me explique como se eu fosse uma criança: Grounding

Dropped by Felipe Nascente e Renan Hamann

STARTUPS

10 anos de OpenAI

Em 2015, a inteligência artificial ainda não vencia humanos no Go e aprendia a jogar Mario usando só um botão. Foi nesse cenário que a OpenAI surgiu em San Francisco com a missão quase ingênua de “construir uma AGI segura para beneficiar a humanidade”. Pra isso, os 11 cofundadores tinham ~US$ 1 bilhão em mãos.

Dez anos depois, apenas 3 dos 11 continuam na OAI, que se tornou a maior startup privada da história, avaliada em US$ 500 bilhões e somando avanços brutais no setor.

2016 – OpenAI Gym: lançou o kit que virou padrão da indústria pra medir aprendizado por reforço.
2019 – OpenAI Five: treinou bots de Dota 2 jogando “anos por dia” e conseguiu vencer campeões mundiais.
2019 – GPT-2: lançou uma IA capaz de gerar textos, saindo do laboratório e entrando no debate público.
2020 – GPT-3: evoluiu o modelo permitindo que exemplos de prompt sejam transformados em material real – e a API é transformada em produto.
2021 – DALL-E e Codex: divulgou o primeiro modelo de imagem da empresa; GPT-3 também virou um assistente de coding na primeira versão do Codex.
2022 – ChatGPT 3.5: o que era para ser uma prévia virou o produto de crescimento mais rápido da história: 100 milhões de usuários em 2 meses.
2023–2024 – GPT-4, Sora, o1: salto em raciocínio, multimodalidade e modelos que "param pra pensar”.
2025 – GPT-5 e a Era dos Agentes: a OpenAI produz uma IA que deixa de ser só chat e começa a executar fluxos inteiros conectados a sistemas reais.
Fim de 2025 — Com fins lucrativos: a empresa que antes soava ingênua, agora possui uma vertente com fins lucrativos e busca ainda mais financiamento e poder de processamento para atingir seus objetivos.

De 2022 até o início deste ano, a OpenAI nadava de braçada – 800 milhões de usuários ativos e zero concorrentes reais no retrovisor. Mas o Google acordou, turbinou o Gemini e botou pressão suficiente pra deixar Sam Altman em “Code Red”.

Enquanto isso, DeepSeek e Alibaba esticam os limites na China, a Anthropic vira a queridinha do setor corporativo e os modelos menores conquistam nichos comendo pelas beiradas. A OpenAI moldou o mercado – mas agora precisa suar pra continuar mandando nele.

Compartilhe no WhatsApp

IA POR AÍ

OpenAI recuou com a estratégia de colocar anúncios nas respostas após reclamações dos usuários pagantes.
Z.ai lançou seu modelo multimodal GLM-4.6V nas versões 106B e 9B; o menor você pode rodar localmente ou via API de graça.
Alibaba apresentou um modelo de IA chamado Live Avatar, onde é possível rodar um agente de IA conversacional em vídeo por até 10 mil segundos.
Google anunciou que irá vender seus óculos de IA em 2026, competindo diretamente com o Rayban Meta.
Mistral lançou o Devstral 2 e Devstral Small 2, com o maior tendo performance similar ao Grok Code Fast 1 e Kimi K2 Thinking; também lançou o Mistral CLI.

Agora o Replit permite utilizar MCPs (que passam informações entre aplicativos) dentro de apps e libera, por exemplo, criar apps com os seus conteúdos de dentro do Notion.

Para adicionar seus próprios MCPs, basta acessar a página de integrações e conectá-los.

Se você se interessa pelo assunto, confira uma biblioteca vasta de MCPs →

MODELOS

Genial no código, perdida no cupom

A corrida da IA pode ter muitos testes de performance em vestibulares, olimpíadas e competições de programação, mas a maioria das IAs falha quando alguém pede para "indicar um notebook barato e bom". Tentando descobrir como metrificar essas falhas, a Mercor criou o ACE, um benchmark dedicado às tarefas do dia a dia.

O benchmark tem 400 tarefas do dia a dia, divididas em quatro áreas: compras, comida, DIY (faça-você-mesmo) e games. Tudo foi construído por 47 especialistas humanos (chefs, gamers, personal shoppers, engenheiros), com critérios objetivos. O topo da tabela ficou concentrado nos modelos da OpenAI:

Modelos testados: Gemini 2.5 Flash e Pro, Gemini 3 Pro, GPT-5, GPT 5.1, o3, o3 Pro, Claude Opus 4.1, 4.5 e Sonnet 4.5 – todos com raciocínio no máximo.
Comida: GPT-5 chegou a 70,1% de acerto em planos de refeição, receitas simples e improviso com ingredientes limitados.
Games: o3 Pro bateu 61,3% em recomendações de jogos, estratégias e explicação de táticas – o segundo colocado foi o GPT 5.1.
DIY: para tarefas de reparo ou execução em casa com assistência da IA, o GPT 5.1 teve o melhor resultado com 55,8%.
Compras: o modelo o3 Pro se saiu melhor com 45,4%, com o GPT-5.1 ficando empatado em segundo com o o3 base, com 44,7%.

Quando o assunto é cupom, frete e boleto, a IA fica no nível “vídeo-cassetadas”. No domínio de compras, um dos maiores problemas era alucinar informações:

Modelos deram links quebrados ou inexistentes em recomendações de produtos e jogos.
Em vários casos, inventaram preços que não batiam com as páginas que eles mesmos usaram como fonte.
Em critérios de compatibilidade (tipo “essa peça serve no meu PC?”), os erros foram frequentes.
Alguns modelos caíram mais de 20 pontos percentuais quando o benchmark passou a exigir que tudo fosse comprovado nas fontes (grounding).

O pulo do gato do ACE é justamente verificar se o que o modelo disse batia com o que estava na web, que ele usou de referência. Quando solicitada uma prova com link/fonte os preços, fichas técnicas e compatibilidade, mostrou que só falavam bonito, mas davam péssimos resultados da busca.

❝

A equipe ainda rodou oito vezes cada caso, somando mais de 220 mil avaliações de critérios, e encontrou uma variação alta entre execuções – o que explica por que às vezes a IA acerta em cheio e, duas mensagens depois, alucina completamente.

O AI Consumer Index (ACE) é um balde de água fria necessário: mostra que a IA já é ótima como assistente geral, mas ainda é um péssimo personal shopper confiável. Cada IA tem uma habilidade diferente, e, aparentemente, o ChatGPT pode ser a melhor para tarefas do dia a dia, enquanto Claude e Gemini são boas para código… e por aí vai.

Compartilhe no WhatsApp

ME EXPLIQUE COMO SE EU FOSSE UMA CRIANÇA

Grounding | Deixando a IA “pé no chão”

O termo se refere a “ancorar” a IA na realidade. Em vez de só chutar com base em textos antigos, ela puxa dados reais na hora. Pode ser de bancos de dados, documentos, APIs, planilhas, internet, o que você conectar.

Isso reduz as “alucinações” (quando a IA inventa informações) e deixa as respostas mais confiáveis. É como alguém que não responde só de cabeça, mas confere no sistema antes de te responder.

E-COMMERCE

Google nas comprinhas

O Google perdeu a Black Friday, mas chegou em tempo de ver os estoques sendo refeitos para o Natal e relançou o Doppl - uma ferramenta para auxiliar na busca de roupas criando um provador virtual -, integrando o novo Nano Banana, Veo e alguns recursos a mais para personalizar a experiência com muita IA:

Você envia uma foto sua ou escolhe um avatar;
Seleciona peças de roupa do catálogo ou de screenshots da sua galeria;
O app gera imagens realistas vestindo o look;
Em seguida, o app pode transformar imagens estáticas em vídeos curtos, mostrando o caimento da roupa e movimento no seu corpo virtual.

O feed tem uma área de vídeos verticais de até 15 segundos no modo “descoberta/for you”, feita pra você compartilhar suas gerações e espiar ideias de looks afinadas com o seu gosto. É basicamente um Pinterest fashion com ~~esteroides~~ algoritmo no modo turbo.

❝

Um ano atrás pensar num feed só de IA podia parecer esquisito, mas a ideia já tá pegando. Além do Doppl, o Sora 2 também já tentou criar um "TikTok de IA" e a Meta fez o mesmo com o Vibes.

Enquanto essas duas ferramentas já são globais, a do Google ainda está limitada aos EUA.

Embora não seja um app pensado para ajustar tamanho, tecido ou fidelidade visual, ele deve virar peça de um projeto maior: ajudar a reduzir devoluções de quem “não recebeu o que esperava” – um dos grandes calos de e-commerces e marketplaces.

Ao mesmo tempo, ele deve se juntar a soluções de compras já lançadas por OpenAI e Perplexity para unir consumidores e vendedores em ambientes que vão muito além do tradicional ciclo “busca de produtos → dúvida → busca de reviews → mais dúvida → compra”.

Compartilhe no WhatsApp

CAIXA DE FERRAMENTAS

Você é uma pessoa muito visual que gosta de utilizar canvas infinitos, quadros brancos para anotação e coisas do tipo? Tenho certeza que vai se interessar pela nova ferramenta gratuita do Google: Mixboard!

Acesse com sua conta do Google;
Crie um novo projeto ou entre em algum pronto para experimentar;
Digite um prompt na barra inferior, por exemplo: “Monte um moodboard com a estética de Art Deco” ou “tigre comendo pão de queijo” e ele irá gerar fotos/imagens do tema;
Transforme suas criações selecionando múltiplas imagens e colocando outros prompts e criando um super mix criativo ou realista dos estilos que quiser mesclar.

Confira todas as ferramentas que nós separamos na cAIxa de ferramentas do AiDrop!

MEME DA SEMANA

O que achou da edição de hoje?

DROPS

Inscreva-se | Indique a News | Anuncie

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau às assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

🤖 10 anos de OpenAI

Hey, Droppers!

STARTUPS

10 anos de OpenAI

IA POR AÍ

MODELOS

Genial no código, perdida no cupom

ME EXPLIQUE COMO SE EU FOSSE UMA CRIANÇA

E-COMMERCE

Google nas comprinhas

CAIXA DE FERRAMENTAS

MEME DA SEMANA

O que achou da edição de hoje?

DROPS

0 comments

Veja as edições anteriores

Junte-se a mais de 90 mil AiDroppers e não fique sem assunto no happy hour.