• AiDrop
  • Posts
  • 🤖 Apple e a decepção

🤖 Apple e a decepção

+ IA por aí: Manus, Mariner, GPT e mais

Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: neste fim de semana, Ilya Sutskever fez um discurso de formatura no qual disse que a IA fará tudo o que os humanos podem fazer. Afinal, todos nós temos cérebros, e o cérebro é um computador biológico. O desafio que a IA representa é o maior desafio da humanidade de todos os tempos – e superá-lo também trará a maior recompensa.

No AiDrop de hoje, repetindo a palavra IA trocentas vezes:

• WWDC: Apple ainda patina na AI
• ElevenLabs: o poder da voz
• Dados: é pegar ou pagar?
• Finanças: usando IA no mercado financeiro
• IA por aí: Manus, Mariner, GPT e mais
• Me explique como se eu fosse uma criança: Distillation

divider
APPLE

Apple Intelligence: 1 passo pra frente, 2 pra trás.

A Apple anunciou o Apple Intelligence (sua própria definição de AI) há um ano no WWDC24. Desde então, o mundo da IA mudou – mas a Apple Intelligence não teve nenhum papel ativo nisso. Agora no WWDC25, nem metade dos recursos prometidos estão prontos e o que estão, deixam a desejar.

Enquanto o mercado viu seus principais players evoluindo a passos largos, a Apple chega tarde e ainda imatura para competir com os adultos.. Basicamente, os “grandes” destaques são:

  • Tradução em tempo real de chamadas, áudios e textos;

  • Função de “Ver e perguntar” sobre qualquer coisa na tela;

  • Criar emojis personalizados com o Genmoji 2.0 + Image Playground

  • Suporte a 8 novos idiomas (ainda não chegou para o PT/BR)

Modelos de ponta oficiais? Nada disso - apenas modelos open-source locais e acesso à infraestrutura do ChatGPT para outras tarefas.

A Apple ainda adotou uma postura "caio, mas caio atirando", lançando um paper sobre as limitações de modelos de reasoning. No shade texto, afirma que esses LLMs 'até fingem que pensam', mas perdem performance ao longo do raciocínio. 

Todos os recursos eram prometidos para o iOS 19 do iPhone 16, mas apesar do iPhone já estar no mercado desde 2024, os novos recursos só chegarão em meados de 2027.

O que Steve Jobs diria para Tim Cook?

A mesma empresa que inventou o iPod, que inventou o iPad, que inventou o iPhone, que decolou com os iMacs, que tem um valor de mercado de US$ 3 trilhões e 164.000 funcionários, até agora não conseguiu competir no que está se tornando a maior inovação no mercado de tecnologia desde os smartphones.

PS: No mercado de ações, a Apple subiu cerca de 0,5% antes da WWDC com a expectativa dos anúncios e caiu pouco mais de 1% com a decepção deles.

VÍDEO

Fala que eu te escuto (se você parecer humano)

Os textos ajudam, os vídeos esclarecem, mas o que realmente cria a conexão humana é a voz. O setor de vendas, por exemplo, vê conversões de 10-15x maiores em interações por voz que outros meios. Não é de se assustar que o mercado startupeiro de IA tem uma nova obsessão: tornar as falas robóticas cada vez mais naturais. Nesse cenário, o lançamento do ElevenLabs v3 (ainda em fase alpha) marca um ponto de virada:

  • Pela primeira vez, vozes em IA podem rir, sussurrar, hesitar ou mudar de sotaque no meio de uma frase — tudo por meio de tags de texto.

  • O modelo cobre mais de 70 idiomas com nuances emocionais antes impossíveis de alcançar sem dubladores profissionais.

  • Seja em campanhas publicitárias, ligações de vendas ou experiências de atendimento, o modelo poderá ser integrado via API.

Na semana passada, a startup Bland sacudiu as expectativas do mercado ao mostrar um recurso de clonagem de voz a partir de apenas uma amostra – e isso pode ter acelerado o roadmap da Eleven. Mas as duas não são as únicas nessa jornada:

  • PlayHT: tem suporte a voz em tempo real, expressividade e diálogos multivoz, é utilizada em voicebots e automações de atendimento em escala.

  • Resemble AI: permite integração direta via API REST, suporte a emoção em tempo real e geração de voz personalizada, muito usada em contact centers.

  • Microsoft Azure Neural TTS: vozes HD com suporte a personalização de fala, com integração direta no ecossistema Azure.

  • Google Cloud Text-to-Speech: com modelos neurais e suporte a emoções, é integrado em soluções de call center e resposta interativa.

  • Amazon Polly: já amplamente usada em unidades de resposta audível, com baixa latência, streaming e compatibilidade com múltiplas linguagens.

Em breve, as tendências de IA generativa poderão se misturar com voz e imagem – deixando os AI influencers ainda mais realistas.

IA POR AÍ
  • Project Mariner, o “Operator” do Google, está sendo liberado para usuários Gemini Ultra e também funciona operando suas abas do Chrome.

  • Manus, o agente de IA chinês, integrou o modelo de vídeos do Google, VEO 3, aos planos pagos.

  • Gemini AI Pro está disponibilizando 3 gerações de vídeo no VEO 3 Fast por dia, em vez de 10 gerações únicas por mês. 

  • CEO do Runway declarou seu desejo de que Hollywood passe a usar vídeos gerados por IA.

  • Merchs do Drop, é o que você pode ostentar se acumular indicações dessa news para seus amigos e colegas (ou até desafetos, vai quê).

  • Google AI Studio poderá se tornar API-based até o final do mês e perder o uso ilimitado do Gemini 2.5 Pro.

  • OpenAI reduziu o preço da API do o3 em 80%, baixando de US$ 10/US$40 para US$ 2/US$ 8, e Sam Altman disse que o preço do o3-pro será “agradável”.

trending

Mais uma surpresa do oriente: 4D Video Player (4DV), uma aplicação que transforma vídeos em experiências tridimensionais, com uma câmera flutuante que o usuário pode controlar.

Confira o vídeo de apresentação ou as demonstrações no site oficial (no desktop) →

PS: Será que queremos isso aplicado ao VAR?

STATS

85%

das empresas brasileiras já usam algum tipo de IA nos seus times de marketing – e 40% é a quantidade das atividades em marketing e vendas que já podem ser automatizadas. Para saber como otimizar os processos no seu time também, confira o roadmap completo do M15.

DIREITO AUTORAL

Dados: quem paga e quem pega?

Desde que o mundo é mundo – ou que a IA Generativa é IA Generativa –, o tema do “direito autoral e o acesso a dados para treinamento” faz parte do debate. E com dois anos de aprendizados, processos judiciais e licenciamentos legais, todo mundo tá seguindo a mesma cartilha, né!? Claro que não.

Nos EUA, o cenário da IA se divide entre quem paga e quem pega. A OpenAI, por exemplo, fechou parceria com a News Corp (dona do WSJ) para usar seu conteúdo. Do outro lado, Anthropic enfrenta processo do Reddit por tentar acessar dados da plataforma mais de 100 mil vezes por dia sem autorização.

O interessante é ver que entre erros e acertos, as estratégias vão se regulando e mostrando os caminhos que devem guiar a ética do setor nos próximos anos:

  • Dados próprios e supervisão rigorosa → estratégia da X, Google e Meta.

  • Pagar por parcerias estratégicas → estratégia (atual) da OpenAI;

  • Testar os limites legais do "fair use" → estratégia de todos.

A esta altura da corrida, já ficou claro que a camada de desenvolvimento de LLMs vai estar concentrada na mão de poucos (big techs). São elas que estão investindo bilhões em poder computacional e fechando acordos (ou roubando) para acessar mais dados. Mesmo assim, o topo do ranking do LM Arena muda toda semana, mas o Google que tem mantido a coroa.

Quem vai ganhar a corrida: Quem tem mais dados? Quem tem os melhores dados?

ME EXPLIQUE COMO SE EU FOSSE UMA CRIANÇA

Destilação

Distillation é uma técnica de IA que treina um modelo menor (o aluno) copiando as respostas de um modelo maior (o professor).

É mais rápido, mais barato e pode ter dado origem a alguns dos modelos mais eficientes que temos atualmente no mercado.

O problema? É que se isso for usado entre concorrentes existem grandes violações dos termos de uso deles.

FINANÇAS

Mercado financeiro 🤝 Inteligência Artificial

O mercado financeiro se alimenta de planilhas, números, cálculos, previsões e uma pitada de paciência para ler, entender e interpretar as horas de horas de apresentação de resultados. Em outras palavras, é o terreno perfeito para a IA se procriar. E isso já está acontecendo:

  • Itaú: o maior banco da América Latina, anunciou seu primeiro assistente virtual de IA para investimentos. Ele deve ser usado primariamente pelos próprios assessores do banco e, em breve, disponibilizado aos clientes.

  • Barclays: o maior banco da Europa, contratou ~100.000 licenças do Microsoft Copilot 365 para sua equipe integrar inteligência artificial no dia a dia interno e dos consumidores.

  • JPMorgan Chase: o maior banco dos Estados Unidos, liberou um assistente virtual de IA para os seus +140.000 funcionários visando melhorar a eficiência operacional – e trazer até ~US$ 2 bi em economia.

Mais do que qualquer outro setor, o mundo das finanças é muito sensível a qualquer deslize em privacidade, segurança e confiabilidade. Logo, as informações utilizadas no treinamento dos LLMs (e as entregues pelo próprio LLM) precisam, obrigatoriamente, ser proprietárias (leia-se, acesso privado).

Fora dos bancos, mas também de olho nas cifra$, o Perplexity não perdeu tempo e bateu de frente com os caríssimos terminais da Bloomberg ao lançar o Perplexity Labs: uma versão da sua ferramenta de IA que gera relatórios completos, cria dashboards interativos, faz análises financeiras, gera gráficos, tem acesso em tempo real a internet e ainda sabe processar dados usando Python!

CAIXA DE FERRAMENTAS
  • AI Hedge Fund: peça a opinião de ações para ícones dos investimentos.

  • Thiings: uma biblioteca de +2.000 ícones em 3D gerados por IA e gratuitos.

  • Consensus: busque em meio a +200mi artigos científicos.

  • MeshyAI: gere modelos 3D e crie animações.

MEME DA SEMANA

Theodore Twombly da vida real flagrado no metrô namorando com o GPT

divider

O que achou da edição de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau as assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

Reply

or to participate.