컴퓨터가 자율적으로 작동할 수 있을까요? 이것이 바로 인간처럼 컴퓨터를 사용할 수 있는 AI 에이전트를 개발하는 스타트업인 Simular의 목표입니다. IBM Think는 Google DeepMind와 Baidu의 자율 주행 분야에서 일했던 Simular의 CEO이자 공동 창업자인 Ang Li와 에이전틱 컴퓨터에 대해 논의했습니다.
Li에 따르면 인간은 컴퓨터와 상호작용할 때 쓸모없는 동작을 하는 데 많은 시간을 소비합니다. 예를 들어, 그가 자신의 팀과 함께 수행한 연구에 따르면 평균적으로 사용자는 마우스를 움직이는 데만 하루에 최대 5시간을 소비합니다.
그는 IBM Think와의 인터뷰에서 "키보드와 마우스는 자연스럽지 않다"고 말했습니다. "우리 세대는 여전히 키보드와 마우스에 익숙하지만, 이전 세대는 그렇지 않았고 다음 세대도 그렇지 않을 것입니다." 대신 Li는 인간이 어떻게 행동하는지 들여다보고 이를 AI의 진화 방식에 적용해야 한다고 말합니다. "기술은 소통하기 쉬운 수단(예: 음성)을 만들고, 기계가 인간처럼 행동하게 함으로써 우리가 더 자연스러운 방식으로 상호작용할 수 있도록 노력합니다."
Simular는 컴퓨터가 완전한 자율 시스템으로 작동하는 미래를 상상합니다. "모두가 AGI[인공 일반 지능]가 휴머노이드 로봇, 자율 주행 자동차처럼 작동한다고 생각합니다."라고 Li는 말했습니다. "저는 그것이 분명히 방향 중 하나라고 생각하지만, 컴퓨터가 제가 하는 모든 일을 할 수 있다면 어떨까요? 이는 이미 인간 수준의 지능입니다." Li는 오픈 소스 프레임워크와 멀티에이전트 시스템 같은 기술이 발전한 덕분에 이제 이를 실현할 수 있다고 믿습니다.
Simular는 올봄 초 macOS에서 기본 브라우저로 출시되었으며, 성취감이나 영향력이 없는 일상적이고 반복적인 작업을 대신할 수 있는 브라우저가 되는 것을 목표로 삼았습니다. Simular의 에이전트는 클라우드에서 실행되는 것아 아니라 기본 WebKit 브라우저를 통해 로컬에서 실행되며, 백그라운드에서 자율적으로 작동하고 사용자가 언제든지 개입할 수 있습니다.
Li의 비전에서 인간은 지속적으로 개입하며 에이전트와 공존합니다. "에이전트는 여전히 많은 실수를 저지르기 때문에 사람이 즉시 개입할 수 있는 능력을 갖추는 것이 중요합니다."라고 그는 말합니다. "이는 마치 회사의 CEO와 같습니다. 월급을 보내거나 다른 회사에 송금하려면 항상 결재할 사람이 필요하잖아요?"
에이전틱 브라우징은 경쟁이 치열한 분야이며, 올해는 경쟁이 더욱 치열해지고 있습니다. The Browser Company는 최근 기존 주력 제품인 Arc의 사용자들을 위해 자체 개발한 에이전틱 브라우징 서비스인 Dia를 공개했습니다.
The Browser Company의 CEO인 Josh Miller는 최근 팟캐스트에서 "AI는 우리가 컴퓨터와 소통하는 방식, 그리고 우리가 컴퓨터를 통해 해결하고자 하는 일들을 변화시킬 것입니다."라고 말했습니다.
1월에 OpenAI는 브라우저 기반 작업을 위한 자율 에이전트인 Operator를 출시했습니다. 몇 주 후, Perplexity는 아직 출시되지 않은 자체 AI 브라우저인 Comet을 예고했습니다. "우리가 브라우저를 사용하는 이유는 에이전트를 구축하는 가장 좋은 방법일 수 있기 때문입니다."라고 Perplexity CEO인 Aravind Srinivas는 지난 4월 The Verge와의 인터뷰에서 말했습니다.
작년 가을, 컴퓨터를 사람처럼 사용하는 개방형 에이전틱 프레임워크에 대한 논문을 이 팀과 함께 발표한 Li는 에이전틱 AI 혁신의 속도가 빠르게 진행되고 있다고 보고 있습니다. 그는 "더 많은 사람들이 이 일에 참여하는 건 좋은 일이라고 생각합니다."고 말했습니다.
그는 가까운 미래에 인간은 창의적인 혁신에 집중할 수 있게 될 것이라고 확신합니다. "기술이 충분히 뛰어나면 모든 사람이 작은 상자나 그보다 더 작은 것을 들고 다닐 것입니다."라고 그는 말했습니다. "그리고 그 상자에 말을 걸면 상자가 알아서 작업을 해줍니다. 화면을 볼 필요가 없습니다. 이것이 바로 제가 생각하는 미래입니다."
