Hey, Droppers!

Na coluna ‘não ferrou’ de hoje: a startup XRAI lançou óculos inteligentes equipados com uma IA especialmente criada para transcrever falas direto nas lentes do usuário. A ideia é permitir mais facilidade de comunicação para pessoas com deficiência auditiva – não exigindo leitura labial ou o uso de línguas de sinais.

No AiDrop de hoje, repetindo a palavra IA trocentas vezes:

• OpenAI: em busca do próprio Nano-Banana
• xAI: o plano de domínio de Musk
• Agentes de IA: melhor sozinho do que mal acompanhado?
• Gemini 3 Flash: leve e poderoso
• IA por aí: Zara, Meta, Nvidia, Alibaba e mais…
• Prompt Like a Pro: fazendo planos para 2026

Dropped by Felipe Nascente e Renan Hamann
LANÇAMENTOS

OpenAI: em busca do próprio Nano-Banana

Depois de apertar o botão de emergência e soltar o GPT-5.2, ficou claro que a OpenAI não estava 100% preparada para os lançamentos do Google – e o seu novo modelo de imagem que estava previsto para janeiro, teve que chegar antes do Natal. Assim surgiu o GPT-Image 1.5.

Reimaginando a seção “Imagens” na barra lateral, a nova versão do ChatGPT conta com uma galeria de prompts novos para você se divertir em vez de ter que caçar prompts na web.

A atualização foi um pouco mais do que incremental:

  • Instruções: agora segue melhor os comandos inseridos no prompt – quanto mais detalhista você for, melhor ele entenderá;

  • Melhor para editar: você pode descrever melhor o que quer fazer na imagem (remover pessoas, isolar, mudar cor da roupa etc.) e ele tende a preservar os detalhes originais.

  • Não leva uma eternidade: um dos gargalos anteriores do GPT-Image era o século que levava para entregar uma imagem gerada; agora, promete gerar até 4x mais rápido que a versão anterior.

No trenó do Papai Noel Altman também vieram os GPT Apps, aplicações que rodam diretamente no ChatGPT e permitem desde o vibe coding até integrações para pedir Uber, por exemplo. Agora:

  • Quem possui uma SaaS/aplicativo pode criar sua própria versão dentro do Apps SDK da OpenAI e aplicar para aprovação;

  • Novos recursos de interface de usuário garantem mais facilidade na customização;

  • Mais liberdade para monetização através dos apps e recomendações de estrutura inicial.

A OpenAI está correndo para chegar ao valuation de ~US$ 750 bilhões e – talvez – estrear seu IPO. Tudo enquanto luta contra o medo da bolha e as desconfianças de que ela não será capaz de levantar capital para pagar todos os cheques que já assinou.

MERCADO

xAI: o plano de domínio de Musk

Atingir a AGI em 2026 e ser a líder global no setor de IA nos próximos três anos…Esses objetivos da xAI podem parecer megalomaníacos, mas Elon Musk tem um plano – e já sabe como vai sustentá-lo.

O plano foi apresentado nos moldes de discurso motivacional pré-final de campeonato e o primeiro passo é sobreviver ao mercado (com ou sem bolha), escalando poder computacional, energia e dinheiro mais rápido do que todos os rivais.

Como Musk é o homem mais rico do mundo e caminha para ser o primeiro trilionário da história, dinheiro nunca parece ser um problema. Não à toa, ele garante que a xAI vai ter acesso a financiamentos entre US$ 20-30 bilhões por ano para escalar brutalmente seus data centers. E o que vem no pacote?

  • Aumentar a operação Colossus das atuais 200 mil GPUs para chegar a 1 milhão;

  • Garantir que o Grok 5 consiga atingir a AGI já em 2026;

  • Acelerar otimizações do Grok Voice;

  • Otimizar funções de agentes e tarefas profissionais;

  • Aumentar a sinergia com Tesla e SpaceX, garantindo que os robôs Optimus operem data centers fora da Terra;

De tudo isso, o maior obstáculo por enquanto não está no espaço, em Marte e nem nas rivais, mas nos clientes. Enquanto Anthropic conquista cada vez mais grandes empresas, Google investe no poder de distribuição do Cloud, OpenAI evolui agentes e Microsoft foca no Copilot integrado ao 365, a xAI ainda patina muito para conseguir grandes contas.

A empresa tem investido em equipes de vendas especializadas, mas ainda sofre para converter leads em clientes. Os principais motivos são falta de experiência com grandes empresas e também a reputação da xAI (principalmente as relações de Musk com anunciantes no X).

Na Terra ou fora dela, o caminho é longo. Mas se existe uma empresa com combustível de sobra pra queimar, essa empresa está na Muskonomy.

IA POR AÍ
  • Adapta*: anunciou o maior pacote de atualizações na sua ferramenta de IA. Você pode assinar antes do aumento de preço, ganhar todas as novidades e mais 3 presentes que valem mais de R$ 2 mil. Clique aqui para ver o que você ganha.

  • Black Forest Labs lançou uma nova versão turbinada do seu modelo de imagens mais recente: flux.2 [MAX].

  • Nvidia reportou que reduzirá o abastecimento de placas de vídeo gamers em cerca de 30-40% – podendo ocasionar aumento no preço das GPUs pessoais.

  • Alibaba lançou a nova versão do seu modelo de vídeos, Wan 2.6, com maior consistência de personagem nas imagens e vozes, com vídeos de 15s e 1080p.

  • Meta apresentou o Segment Anything Model (SAM) na versão Áudio, onde poderá isolar qualquer tipo de áudio que sair da seleção (animal, pessoa, etc.).

  • xAI colocou no ar a nova API do Grok Voice Agent, com diversas vozes e custando US$ 0,05/minuto de chamada.

  • Zara começou a usar IA para testar roupas em modelos reais, acelerando campanhas, mas causando receio no setor de fotografia.

*conteúdo de marca parceira

O Wall Street Journal fez um experimento utilizando o Claude dentro de uma máquina de vendas, com ele recomprando o estoque e renegociando preços através do Slack, com os +70 jornalistas do escritório.

O resultado foi: lanches de graça, um PlayStation 5, mais de US$ 1.000 de prejuízo e champanhe para comemorar o Hanukkah.

Resumindo: o teste que a Anthropic fez (que contamos aqui) também não funcionaria no mundo real. Não deixe a IA comprar coisas por você.

AGENTES

Agentes de IA: melhor sozinho do que mal acompanhado?

Utilizar vários agentes de IA é quase como colocar mais gente na sala e somente aumentar a discussão em vez de realmente resolver o problema. O Google DeepMind se juntou com o MIT e fez o teste “o que é melhor: um agente ou vários agentes trabalhando junto?”, e o resultado faz sentido com a vida real.

Costumamos achar que sempre várias cabeças pensam melhor. Mas imagine que cada agente de IA tem sua própria pilha de itens: se outro coloca a mão, às vezes pode derrubar.

E aí, o que era para ser colaboração vira retrabalho: mais trocas de mensagens, mais necessidade de coordenação e maior o custo – e nem sempre mais acerto.

Os “formatos de times” testados se equivalem aos frameworks:

  • Centralizado: tem um chefe que divide as tarefas, agrega as respostas e decide o próximo passo.

  • Descentralizado: os agentes conversam entre si e vão ajustando coletivamente, sem um controlador.

  • Independente: vários agentes trabalham em paralelo, sem conversar. Comparações e combinações apenas com as saídas no final.

  • Híbrido: mistura troca entre agentes, com algum nível de controle, tentando balancear entre autonomia e direção.

Os fluxos de multiagentes não são apenas “implantar e ver a mágica acontecer”. Para obter resultados, precisam ser aplicados em situações específicas; o estudo separou a partir do tipo de tarefa:

  • Melhor cenário (onde realmente compensa): em finanças, a coordenação centralizada chegou a 80% melhor performance – versus um agente sozinho.

  • Cenário “ok” (onde fez diferença, mas pouca): na navegação na web para coleta de informações, o descentralizado ficou ~9% acima do agente sozinho, enquanto o centralizado quase empatou (+0,2%).

  • Pior cenário: em planejamento sequencial, as variantes multiagentes caíram de -39% até -70% em performance.

  • E o custo só dificulta a situação: além de terem resultados piores, o uso de tokens aumenta de +58% (independente) a até +515% (híbrido).

A pergunta certa a se fazer não é “quantos agentes eu consigo colocar aqui?” mas sim “qual arquitetura devo utilizar para solucionar esse problema?” e “quanto eu estou disposto a pagar pela coordenação?”.

PROMPT LIKE A PRO

Fazendo planos para 2026

Se você usa IA até pra transformar suas fotos, por que não aproveitar e criar planos para fazer com que o ano que vem seja ainda melhor?

# Você é meu estrategista pessoal.
# Quero definir 3 resultados grandes para os próximos 12 meses (carreira, saúde/energia, dinheiro/estilo de vida).
Para cada resultado:

1. Defina a métrica (como vou medir);
2. Descreva o estado final em 2–3 frases;
3. Crie um plano de 12 meses com 1 microvitória por mês (ações pequenas, mas acumulativas);
4. Liste os 5 maiores riscos que podem me atrapalhar e como mitigar;
5. Proponha uma rotina semanal para manter o progresso;
6. Contexto: me faça 12 perguntas para entender a minha rotina, restrições, prioridades, o que não quero sacrificar etc.

LLMs

Gemini 3 Flash: leve e poderoso

Depois de lançar Gemini 3 Pro liderando os benchmarks e o Nano-Banana-Pro redefinindo os padrões de qualidade da geração de imagens com IA, o Google decidiu anunciar também o Gemini 3 Flash, a versão mais rápida (e mais barata) do seu melhor modelo.

Embora o novo modelo seja uma versão compactada do modelo maior, ele está à frente de vários concorrentes:

  • Compreensão multimodal (MMMU-Pro/MMMLU): melhor que todos os modelos comparados (GPT-5.2, Claude Sonnet 4.5, Grok 4.1 Fast, e até que o Gemini 3 Pro em um dos testes);

  • Engenharia de Software/programação (SWE-bench): melhor que o próprio Gemini 3 Pro, Claude Sonnet 4.5 e Grok 4.1 Fast;

  • Conhecimentos comuns em 100 linguagens e culturas: perde somente para o Gemini 3 Pro, vence de todos os outros;

  • Os testes mais difíceis da atualidade (ARC-AGI-2 e Humanity’s Last Exam): fica com performance próxima a GPT-5.2 e Gemini 3 Pro – bem pouco abaixo de ambos.

Nos outros testes, o modelo tem desempenho igual ou superior aos concorrentes, e com o preço (por 1mi tokens, US$ 0,50/input | US$ 3,00/output) sendo 4x menor que o Gemini 3 Pro.

O modelo se encaixa em ~80-90% das tarefas que você pode utilizar uma IA no dia a dia (para chatbots e automações), sem perder qualidade.

Esse é o maior salto que tivemos em uma versão geracional de modelo de linguagem, já que o Gemini 2.5 Flash estava na 49ª posição e o 3.0 saltou para a 3ª na tabela de texto do LM Arena – reforçando o barateamento da IA ao longo do tempo e levando a possibilidade de aplicações completas até para empresas sem infraestrutura dedicada.

GAME: QUAL IMAGEM É GERADA POR IA?

Nas próximas duas quintas-feiras teremos feriados, então esse é o último game do ano!

A brincadeira dessa vez vai ser diferente:
Qual dessas é QUAL IA: Nano-banana Pro ou GPT-Image-1.5?

Alternativa A

Alternativa B

Qual é a IA usada para gerar o Papai Noel da Coca?

(isso não é patrocinado)

Login or Subscribe to participate

O que achou da edição de hoje?

Login or Subscribe to participate

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau às assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

0 comments

or to participate

Veja as edições anteriores

No posts found