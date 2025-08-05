É atraente, pequeno, atraente e programável em Python. Conheça o Reachy Mini, um robô compacto e de código aberto da Hugging Face projetado para ser usado por desenvolvedores, consumidores comuns e até crianças. E desde que a Hugging Face anunciou o lançamento em julho, o Reachy Mini, disponível em pré-venda, superou as expectativas, de acordo com a Pollen robótica, empresa de robótica recentemente adquirida pela empresa de IA.
2025 está se tornando o ano da IA física. De acordo com a NASDAQ, o mercado deve crescer de US$ 12,77 bilhões em 2023 para US$ 124,77 bilhões até 2030. A NVIDIA também anunciou o primeiro modelo de base humanoide aberto, o GROOT N1. E os robôs já estão sendo colocados em ação: a Amazon acaba de implementar seu milionésimo robô em julho de 2025, e o Waymo do Google forneceu mais de 10 milhões de corridas até maio de 2025.
Mas os robôs estão prontos para a vida cotidiana? O IBM Think se reuniu com os fundadores que construíam em direção a esse futuro.
Anto Patrex deixou seu trabalho em uma grande empresa de IA este ano para lançar a CosmicBrain, uma startup que enfrenta um dos maiores desafios da robótica: dados.
"Muitas pessoas começaram a construir e usar IA para aprimorar a robótica", disse ele em entrevista ao IBM Think. “Essa é uma das razões pelas quais eu pedi demissão. Senti que, se não estivesse no espaço a partir de hoje, estaria perdendo muito.”
A CosmicBrain desenvolve modelos de simulação para treinar robôs usando dados de tarefas humanas, coletados por meio de quaisquer óculos inteligentes vestíveis. “Se você observar robôs de empresas de inteligência física, eles estão sendo treinados usando teleoperação”, explicou Patrex. “Isso não é um método escalável, então, quando são implementados em um armazém real ou em um campo agrícola, eles não têm um conjunto de dados diverso.”
A ideia? Uma app store plug-and-play para robôs, acessível a todos: desenvolvedores, estudantes ou empresas interessadas em treinar seus robôs. “Estamos criando uma Google Play Store ou uma App Store para robôs”, disse ele. "É como a Matrix moderna. Teremos centenas de milhares de conjuntos de habilidades que você simplesmente conecta, e o robô saberá o que fazer.
”Patrex afirmou que o plano é coletar mais de 50 milhões de horas de vídeo nos próximos dois anos. A próxima etapa será usar esses dados para gerar dados sintéticos.
“Há muitas coisas que não conseguimos realmente fazer no mundo real”, disse. “O que acontece se o robô deixar um pacote escorregar? Como ele o recolhe? Podemos ensinar esses robôs a fazer isso, ou a reconhecer 100 variedades de frutas diferentes, como colher cerejas versus tomates, maçãs e laranjas.”
A CosmicBrain vê seu impacto potencial no ecossistema de robótica de forma semelhante ao da Scale AI — especializada em anotação de dados — e ao que Google, Microsoft, Meta, OpenAI e Anthropic tiveram no boom da IA generativa. “Exceto que a Scale AI vendia seus dados”, afirmou. "Não venderemos nossos dados. Em vez disso, venderemos conjuntos de habilidades como APIs, então os dados permanecerão com a empresa.
”Há alguns dias, Elon Musk, CEO da Tesla, previu que os robôs Optimus da empresa poderiam gerar USD 30 trilhões em receita, e Patrex concorda. “Em breve, você verá [todos]… construindo robôs, reparando robôs, pintando robôs, treinando robôs”, disse Patrex. "Uma economia gigantesca surgirá."
Esse futuro já está se materializando para Jan Libhardt, professor associado de Bioengenharia em Stanford e fundador da OpenMind, uma stack de software aberta e nativa de IA para robôs que planeja abrir sua primeira loja em São Francisco este ano.
"Isso vai acontecer este ano, não em 2037", disse Labhardt ao IBM Think. "E não somos só nós."
Fã de longa data de robôs de ficção científica, Labhardt observou a lacuna entre os robôs fictícios e as máquinas industriais na vida real. "Muitos de nós já vimos filmes em que as pessoas interagem com robôs", disse ele. "E até alguns anos atrás, os robôs eram construídos para migrar um pedaço de metal e solda-lo em outro pedaço de metal, para fins industriais. Havia essa lacuna enorme entre o tipo de robôs que víamos nos filmes e lemos sobre na ficção científica e o tipo de robôs que víamos ao nosso redor."
Isso mudou durante o boom da IA generativa.
"Eu estava olhando para LLMs como há alguns anos", disse ele. "Eu estava curioso para ver se o conjunto de saídas poderia ser expandido de texto para ações no mundo real."
Ele começou a escrever software para controlar robôs domésticos — ajudando crianças com lição de casa, latindo para visitantes desconhecidos e até mapeando parques. “Os LLMs não apenas conseguem escrever código de computador, como também podem emitir comandos para hardware”, disse Liphardt. “Isso foi realmente empolgante para mim.
”Ele acredita que os LLMs resolvem desafios centrais como a fusão de dados, o processo de integrar dados de múltiplas fontes para produzir uma saída coesa e informativa.– “Uma vantagem de usar linguagem para descrever o mundo físico é que isso se encaixa naturalmente no modo como os grandes modelos de linguagem funcionam — eles são ótimos em compreender, continuar e gerar histórias a partir desse tipo de input.”
Ainda assim, nem tudo funciona como pretendido. Um de seus robôs, por exemplo, tende a latir para pessoas em situação de rua. "É claro que não programamos isso", disse ele. “Mas a ideia de que uma pessoa sem-teto é assustadora deve estar presente nos dados de treinamento.”
“Esse [viés nos dados de treinamento] não é específico de robôs”, afirmou Liphardt. “E o que é importante para mim é simplesmente observar isso e, então, pensar em boas maneiras de controlar ou governar a tecnologia. E isso também é um problema totalmente não resolvido. Se você considerar a intersecção entre governança de alinhamento e grandes modelos de linguagem, esse é um problema muito, muito maior do que qualquer esforço de software para robôs.”
Estimular a adoção por desenvolvedores pode ser o que finalmente levará a robótica ao mainstream. Esse é o princípio por trás da entrada da Hugging Face nesse espaço. “Com hardware mais barato e IA open source, acreditamos que isso pode ser o momento ChatGPT da robótica”, disse Clément Delangue, CEO da Hugging Face, em um episódio recente do podcast TBPN.
A K-Scale Labs, uma empresa de robótica humanoide de código aberto sediada em São Francisco, trabalha com a mesma premissa. Eles começarão a enviar o K-Bot, um robô pessoal com locomoção básica, controle por voz e um conjunto de comandos pré-definido, em dezembro de 2025.“
"Penso que é muito importante ter uma plataforma de desenvolvedores de código aberto realmente", disse Benjamin Bolte, fundador e CEO da K-Scale Labs, em uma entrevista.
Ex-engenheiro da Tesla e da Meta, Bolte acredita que, assim como nos primeiros dias dos PCs e consoles de videogame, o crescimento real virá dos "early adopters" (primeiros usuários), desenvolvedores e entusiastas.
A K-Scale Labs aposta em alguns casos de uso principais — e na abertura. “Tentar ditar como tudo deve funcionar é o caminho errado”, disse Bolte. “Se permitirmos que as pessoas realmente experimentem com robôs e construam a experiência do produto elas mesmas, acho que veremos um enorme efeito downstream — como um ecossistema de desenvolvedores de aplicativos para humanoides.”
Aproveitando o interesse pelo Reachy 2, um robô humanoide totalmente de código aberto desenvolvido pela Pollen Robotics, a empresa criou o Reachy Mini, um robô pessoal disponível apenas por pré-encomenda. Não é um humanoide completo, mas um potencial assistente diário capaz de se movimentar pela casa, conversar, ouvir e perceber o ambiente.
“O leque de aplicações é enorme”, afirmou Anne-Charlotte Passanisi, Senior Product Manager da Pollen Robotics, adquirida pela Hugging Face no início deste ano. “Estamos construindo os blocos para permitir que as pessoas criem coisas incríveis. O objetivo é um robô amigável para a família, que qualquer pessoa possa programar. Ainda não chegamos lá, mas o potencial é enorme.”
