Perplexity AI lança orquestrador híbrido local-nuvem no Computex 2026

Redator ReviewTechIA2 de junho de 20265 Mins read7

Perplexity AI apresenta orquestrador híbrido local-nuvem no Computex 2026

A Perplexity AI, startup de busca avaliada em US$ 20 bilhões, revelou no Computex 2026 aquilo que descreve como o primeiro orquestrador híbrido de inferência local e servidor do mercado. O sistema decide de forma autônoma, em tempo real e no meio de uma tarefa, quais cargas de trabalho de IA permanecem no dispositivo do usuário e quais são enviadas para modelos na nuvem.

A demonstração aconteceu durante o keynote da Intel, com o CEO da Perplexity, Aravind Srinivas, no palco ao lado do CEO da Intel, Lip-Bu Tan. O produto usado na apresentação foi o Personal Computer da Perplexity, que processou materiais confidenciais de negócios enquanto o sistema determinava dinamicamente o destino de cada dado.

Como funciona o roteamento automático de tarefas

O ponto central da novidade não é simplesmente rodar um modelo de IA localmente — isso já é feito por dezenas de ferramentas disponíveis. O diferencial está no fato de que o sistema da Perplexity toma a decisão de roteamento por conta própria, tarefa por tarefa, sem que o usuário precise escolher nada com antecedência.

Na prática, dados sensíveis como registros financeiros ou informações de saúde ficam no dispositivo local. Tarefas que exigem raciocínio mais complexo, compatível com modelos de escala frontier, são enviadas à nuvem. Uma única tarefa pode ser executada em múltiplos locais físicos, com orquestração totalmente automática.

Durante a demonstração, modelos locais rodando em processadores Intel Core Ultra Series 3 avaliavam quais informações poderiam sair do dispositivo. Segundo a empresa, o sistema solicita permissão ao usuário antes de enviar tarefas sensíveis para a nuvem — um mecanismo de governança de dados relevante para empresas preocupadas com o uso de agentes de IA.

“Nenhum produto fez isso antes”, afirmou um porta-voz da Perplexity ao VentureBeat.

O recurso ainda não está disponível ao público, mas a empresa informou que o lançamento deve ocorrer nas próximas semanas.

A trajetória do produto: de agentes na nuvem à orquestração no dispositivo

Para entender o significado dessa apresentação, vale acompanhar o caminho que a Perplexity percorreu ao longo de 2025 e 2026.

Em fevereiro de 2025, a empresa lançou o Perplexity Computer, um agente multimodelo que orquestra 19 modelos de IA diferentes para executar tarefas complexas. O sistema funcionava inteiramente na nuvem, dividindo objetivos em subtarefas e roteando cada uma ao modelo mais adequado — Claude, Gemini, GPT, Grok, entre outros.

Em março, durante sua primeira conferência de desenvolvedores, a Ask 2026, a Perplexity apresentou o Personal Computer como um aplicativo para Mac com suporte a um agente híbrido local-nuvem. O produto acessava o sistema de arquivos e aplicativos nativos do Mac para criar e executar fluxos de trabalho completos, com arquivos gerados em um ambiente seguro e todas as ações auditáveis e reversíveis.

O que foi demonstrado no Computex vai além dessa divisão anterior. Antes, o Personal Computer separava as responsabilidades de forma relativamente clara: acesso a arquivos no dispositivo, processamento pesado nos servidores. O novo orquestrador de inferência híbrida permite que o próprio sistema raciocine sobre onde cada parte de uma tarefa deve ser executada — não apenas qual modelo usar, mas em qual local físico o processamento ocorrerá.

O contexto estratégico: chips e soberania de dados

A escolha do Computex 2026 para a apresentação não foi coincidência. O evento foi dominado pelo tema de IA no dispositivo. Poucas horas antes do keynote da Intel, o CEO da Nvidia, Jensen Huang, revelou o RTX Spark, um superchip baseado em ARM com até 20 núcleos de CPU, GPU Blackwell com 6.144 núcleos CUDA, 128 GB de RAM LPDDR5X e largura de banda de memória de até 300 GB/s — hardware capaz de rodar modelos com 120 bilhões de parâmetros e contextos de até um milhão de tokens. Os primeiros dispositivos com RTX Spark chegam ao mercado no segundo semestre de 2025.

A Intel, por sua vez, usou seu keynote para apresentar os processadores Xeon 6+ com 288 núcleos de eficiência para data centers, além de posicionar o Core Ultra Series 3 como o chip cliente que viabiliza a inferência híbrida no PC.

O orquestrador da Perplexity se posiciona exatamente na interseção dessas duas estratégias. Se o sistema funcionar conforme prometido, cria um incentivo econômico direto para que usuários e empresas invistam em chips locais mais potentes: quanto mais capaz o processador do dispositivo, mais inferência pode rodar localmente, reduzindo custos com nuvem e melhorando a latência em cargas sensíveis.

As implicações vão além da economia de chips. Um porta-voz da Perplexity disse ao VentureBeat que, à medida que os chips ficam mais poderosos, mais inteligência migra para o dispositivo do usuário, o que pode reduzir a necessidade de grandes infraestruturas nacionais de computação. Países como Emirados Árabes Unidos, França e Índia têm investido bilhões em capacidade doméstica de IA, em parte pela premissa de que dados sensíveis precisam permanecer dentro de suas fronteiras. Se inferências significativas puderem rodar localmente sem que dados saiam do dispositivo, esse cálculo muda.

A aposta na camada de orquestração como diferencial competitivo

A estratégia de inferência híbrida da Perplexity repousa sobre uma convicção que a empresa tem sustentado ao longo de todo o ano: a camada de orquestração importa mais do que qualquer modelo individual.

A lógica é a separação de responsabilidades: a camada de orquestração cuida da decomposição de tarefas, do gerenciamento de estado e da coordenação de ferramentas, enquanto a camada de modelos lida com computações específicas. Esse desacoplamento permite trocar modelos conforme surgem alternativas melhores, sem redesenhar o sistema inteiro.

Com o orquestrador híbrido, a Perplexity vai além: agora orquestra não apenas entre modelos, mas entre localizações físicas de computação. Um modelo leve local pode resumir um documento confidencial, enquanto um modelo frontier na nuvem analisa esse resumo em relação a um cenário de mercado mais amplo. O orquestrador gerencia a transição entre os dois ambientes.

É uma afirmação tecnicamente ambiciosa. Para funcionar de forma confiável em produção, o orquestrador precisará avaliar com precisão a complexidade de cada subtarefa, compreender a sensibilidade dos dados envolvidos, conhecer as capacidades do hardware local do usuário e manter o estado de uma tarefa que pode alternar entre ambientes durante a execução.

A empresa afirma que o sistema será agnóstico em relação ao chip, embora a demonstração inicial no Computex tenha rodado sobre silicon da Intel. Para saber mais sobre o ecossistema de chips para IA em dispositivos, a Intel Newsroom acompanha os lançamentos da linha Core Ultra em tempo real.

Perguntas frequentes

O que é o orquestrador híbrido de inferência da Perplexity AI?

É um sistema que decide automaticamente, em tempo real e durante a execução de uma tarefa, quais partes do processamento de IA ficam no dispositivo local do usuário e quais são enviadas para modelos na nuvem, sem que o usuário precise configurar nada manualmente.

Quando o recurso híbrido local-nuvem da Perplexity estará disponível?

Segundo a Perplexity AI, o recurso de inferência híbrida será lançado nas próximas semanas após a apresentação no Computex 2026, realizada em maio de 2025. Ainda não há uma data exata confirmada.

Como o sistema da Perplexity protege dados sensíveis do usuário?

Dados confidenciais, como registros financeiros e informações de saúde, permanecem no dispositivo local. O sistema solicita permissão ao usuário antes de enviar qualquer tarefa sensível para a nuvem, oferecendo controle sobre a governança dos dados.

Qual é a diferença entre o Perplexity Computer e o Personal Computer?

O Perplexity Computer, lançado em fevereiro de 2025, opera inteiramente na nuvem orquestrando 19 modelos de IA. O Personal Computer, apresentado em março de 2025, é um aplicativo para Mac que combina processamento local e na nuvem, com acesso ao sistema de arquivos do dispositivo e execução de fluxos de trabalho em ambiente seguro.