Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: neste fim de semana, Ilya Sutskever fez um discurso de formatura no qual disse que a IA farĂĄ tudo o que os humanos podem fazer. Afinal, todos nĂłs temos cĂ©rebros, e o cĂ©rebro Ă© um computador biolĂłgico. O desafio que a IA representa Ă© o maior desafio da humanidade de todos os tempos – e superĂĄ-lo tambĂ©m trarĂĄ a maior recompensa.

❝

No AiDrop de hoje, repetindo a palavra IA trocentas vezes:

‱ WWDC: Apple ainda patina na AI
‱ ElevenLabs: o poder da voz
‱ Dados: Ă© pegar ou pagar?
‱ Finanças: usando IA no mercado financeiro
‱ IA por aí: Manus, Mariner, GPT e mais
‱ Me explique como se eu fosse uma criança: Distillation

APPLE

Apple Intelligence: 1 passo pra frente, 2 pra trĂĄs.

A Apple anunciou o Apple Intelligence (sua própria definição de AI) há um ano no WWDC24. Desde então, o mundo da IA mudou – mas a Apple Intelligence não teve nenhum papel ativo nisso. Agora no WWDC25, nem metade dos recursos prometidos estão prontos e o que estão, deixam a desejar.

Enquanto o mercado viu seus principais players evoluindo a passos largos, a Apple chega tarde e ainda imatura para competir com os adultos.. Basicamente, os “grandes” destaques são:

  • Tradução em tempo real de chamadas, ĂĄudios e textos;

  • Função de “Ver e perguntar” sobre qualquer coisa na tela;

  • Criar emojis personalizados com o Genmoji 2.0 + Image Playground

  • Suporte a 8 novos idiomas (ainda nĂŁo chegou para o PT/BR)

Modelos de ponta oficiais? Nada disso - apenas modelos open-source locais e acesso Ă  infraestrutura do ChatGPT para outras tarefas.

❝

A Apple ainda adotou uma postura "caio, mas caio atirando", lançando um paper sobre as limitaçÔes de modelos de reasoning. No shade texto, afirma que esses LLMs 'até fingem que pensam', mas perdem performance ao longo do raciocínio. 

Todos os recursos eram prometidos para o iOS 19 do iPhone 16, mas apesar do iPhone jĂĄ estar no mercado desde 2024, os novos recursos sĂł chegarĂŁo em meados de 2027.

O que Steve Jobs diria para Tim Cook?

A mesma empresa que inventou o iPod, que inventou o iPad, que inventou o iPhone, que decolou com os iMacs, que tem um valor de mercado de US$ 3 trilhÔes e 164.000 funcionårios, até agora não conseguiu competir no que estå se tornando a maior inovação no mercado de tecnologia desde os smartphones.

PS: No mercado de açÔes, a Apple subiu cerca de 0,5% antes da WWDC com a expectativa dos anĂșncios e caiu pouco mais de 1% com a decepção deles.

VÍDEO

Fala que eu te escuto (se vocĂȘ parecer humano)

Os textos ajudam, os vĂ­deos esclarecem, mas o que realmente cria a conexĂŁo humana Ă© a voz. O setor de vendas, por exemplo, vĂȘ conversĂ”es de 10-15x maiores em interaçÔes por voz que outros meios. NĂŁo Ă© de se assustar que o mercado startupeiro de IA tem uma nova obsessĂŁo: tornar as falas robĂłticas cada vez mais naturais. Nesse cenĂĄrio, o lançamento do ElevenLabs v3 (ainda em fase alpha) marca um ponto de virada:

  • Pela primeira vez, vozes em IA podem rir, sussurrar, hesitar ou mudar de sotaque no meio de uma frase — tudo por meio de tags de texto.

  • O modelo cobre mais de 70 idiomas com nuances emocionais antes impossĂ­veis de alcançar sem dubladores profissionais.

  • Seja em campanhas publicitĂĄrias, ligaçÔes de vendas ou experiĂȘncias de atendimento, o modelo poderĂĄ ser integrado via API.

Na semana passada, a startup Bland sacudiu as expectativas do mercado ao mostrar um recurso de clonagem de voz a partir de apenas uma amostra – e isso pode ter acelerado o roadmap da Eleven. Mas as duas nĂŁo sĂŁo as Ășnicas nessa jornada:

  • PlayHT: tem suporte a voz em tempo real, expressividade e diĂĄlogos multivoz, Ă© utilizada em voicebots e automaçÔes de atendimento em escala.

  • Resemble AI: permite integração direta via API REST, suporte a emoção em tempo real e geração de voz personalizada, muito usada em contact centers.

  • Microsoft Azure Neural TTS: vozes HD com suporte a personalização de fala, com integração direta no ecossistema Azure.

  • Google Cloud Text-to-Speech: com modelos neurais e suporte a emoçÔes, Ă© integrado em soluçÔes de call center e resposta interativa.

  • Amazon Polly: jĂĄ amplamente usada em unidades de resposta audĂ­vel, com baixa latĂȘncia, streaming e compatibilidade com mĂșltiplas linguagens.

Em breve, as tendĂȘncias de IA generativa poderĂŁo se misturar com voz e imagem – deixando os AI influencers ainda mais realistas.

IA POR AÍ
  • Project Mariner, o “Operator” do Google, estĂĄ sendo liberado para usuĂĄrios Gemini Ultra e tambĂ©m funciona operando suas abas do Chrome.

  • Manus, o agente de IA chinĂȘs, integrou o modelo de vĂ­deos do Google, VEO 3, aos planos pagos.

  • Gemini AI Pro estĂĄ disponibilizando 3 geraçÔes de vĂ­deo no VEO 3 Fast por dia, em vez de 10 geraçÔes Ășnicas por mĂȘs.

  • CEO do Runway declarou seu desejo de que Hollywood passe a usar vĂ­deos gerados por IA.

  • Merchs do Drop, Ă© o que vocĂȘ pode ostentar se acumular indicaçÔes dessa news para seus amigos e colegas (ou atĂ© desafetos, vai quĂȘ).

  • Google AI Studio poderĂĄ se tornar API-based atĂ© o final do mĂȘs e perder o uso ilimitado do Gemini 2.5 Pro.

  • OpenAI reduziu o preço da API do o3 em 80%, baixando de US$ 10/US$40 para US$ 2/US$ 8, e Sam Altman disse que o preço do o3-pro serĂĄ “agradĂĄvel”.

Mais uma surpresa do oriente: 4D Video Player (4DV), uma aplicação que transforma vĂ­deos em experiĂȘncias tridimensionais, com uma cĂąmera flutuante que o usuĂĄrio pode controlar.

PS: SerĂĄ que queremos isso aplicado ao VAR?

STATS

85%

das empresas brasileiras jĂĄ usam algum tipo de IA nos seus times de marketing – e 40% Ă© a quantidade das atividades em marketing e vendas que jĂĄ podem ser automatizadas. Para saber como otimizar os processos no seu time tambĂ©m, confira o roadmap completo do M15.

DIREITO AUTORAL

Dados: quem paga e quem pega?

Desde que o mundo Ă© mundo – ou que a IA Generativa Ă© IA Generativa –, o tema do “direito autoral e o acesso a dados para treinamento” faz parte do debate. E com dois anos de aprendizados, processos judiciais e licenciamentos legais, todo mundo tĂĄ seguindo a mesma cartilha, nĂ©!? Claro que nĂŁo.

Nos EUA, o cenĂĄrio da IA se divide entre quem paga e quem pega. A OpenAI, por exemplo, fechou parceria com a News Corp (dona do WSJ) para usar seu conteĂșdo. Do outro lado, Anthropic enfrenta processo do Reddit por tentar acessar dados da plataforma mais de 100 mil vezes por dia sem autorização.

O interessante é ver que entre erros e acertos, as estratégias vão se regulando e mostrando os caminhos que devem guiar a ética do setor nos próximos anos:

  • Dados prĂłprios e supervisĂŁo rigorosa → estratĂ©gia da X, Google e Meta.

  • Pagar por parcerias estratĂ©gicas → estratĂ©gia (atual) da OpenAI;

  • Testar os limites legais do "fair use" → estratĂ©gia de todos.

A esta altura da corrida, jå ficou claro que a camada de desenvolvimento de LLMs vai estar concentrada na mão de poucos (big techs). São elas que estão investindo bilhÔes em poder computacional e fechando acordos (ou roubando) para acessar mais dados. Mesmo assim, o topo do ranking do LM Arena muda toda semana, mas o Google que tem mantido a coroa.

Quem vai ganhar a corrida: Quem tem mais dados? Quem tem os melhores dados?

ME EXPLIQUE COMO SE EU FOSSE UMA CRIANÇA

Destilação

Distillation é uma técnica de IA que treina um modelo menor (o aluno) copiando as respostas de um modelo maior (o professor).

É mais rápido, mais barato e pode ter dado origem a alguns dos modelos mais eficientes que temos atualmente no mercado.

O problema? É que se isso for usado entre concorrentes existem grandes violaçÔes dos termos de uso deles.

FINANÇAS

Mercado financeiro đŸ€ InteligĂȘncia Artificial

O mercado financeiro se alimenta de planilhas, nĂșmeros, cĂĄlculos, previsĂ”es e uma pitada de paciĂȘncia para ler, entender e interpretar as horas de horas de apresentação de resultados. Em outras palavras, Ă© o terreno perfeito para a IA se procriar. E isso jĂĄ estĂĄ acontecendo:

  • ItaĂș: o maior banco da AmĂ©rica Latina, anunciou seu primeiro assistente virtual de IA para investimentos. Ele deve ser usado primariamente pelos prĂłprios assessores do banco e, em breve, disponibilizado aos clientes.

  • Barclays: o maior banco da Europa, contratou ~100.000 licenças do Microsoft Copilot 365 para sua equipe integrar inteligĂȘncia artificial no dia a dia interno e dos consumidores.

  • JPMorgan Chase: o maior banco dos Estados Unidos, liberou um assistente virtual de IA para os seus +140.000 funcionĂĄrios visando melhorar a eficiĂȘncia operacional – e trazer atĂ© ~US$ 2 bi em economia.

Mais do que qualquer outro setor, o mundo das finanças é muito sensível a qualquer deslize em privacidade, segurança e confiabilidade. Logo, as informaçÔes utilizadas no treinamento dos LLMs (e as entregues pelo próprio LLM) precisam, obrigatoriamente, ser proprietårias (leia-se, acesso privado).

Fora dos bancos, mas também de olho nas cifra$, o Perplexity não perdeu tempo e bateu de frente com os caríssimos terminais da Bloomberg ao lançar o Perplexity Labs: uma versão da sua ferramenta de IA que gera relatórios completos, cria dashboards interativos, faz anålises financeiras, gera gråficos, tem acesso em tempo real a internet e ainda sabe processar dados usando Python!

CAIXA DE FERRAMENTAS
  • AI Hedge Fund: peça a opiniĂŁo de açÔes para Ă­cones dos investimentos.

  • Thiings: uma biblioteca de +2.000 Ă­cones em 3D gerados por IA e gratuitos.

  • Consensus: busque em meio a +200mi artigos cientĂ­ficos.

  • MeshyAI: gere modelos 3D e crie animaçÔes.

MEME DA SEMANA

Theodore Twombly da vida real flagrado no metrĂŽ namorando com o GPT

O que achou da edição de hoje?

Login or Subscribe to participate

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. NĂłs filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudĂĄvel, rĂĄpida e inteligente, diretamente no seu inbox. DĂȘ tchau as assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

0 comments

Avatar

or to participate

Veja as ediçÔes anteriores