[특별 기획] 2025 ICT 산업 리뷰 및 전망; [2편] 온디바이스 AI

AI 기술은 더 이상 클라우드 데이터센터 안에만 머물지 않고, 스마트폰과 웨어러블, 나아가 스마트안경과 같은 개인 디바이스, “온디바이스 AI”로 이동하고 있습니다. 엣지 컴퓨팅 기반의 AI 전환은 지연 시간 단축, 데이터 프라이버시 향상, 네트워크 비용 절감 등의 이점을 제공하면서 AI가 더 이상 클라우드에 의존하지 않고도 사용자 가까이에서 실시간 동작할 수 있도록 합니다. 그리고 이러한 변화는 모바일 기술의 패러다임을 바꾸며, AI를 사용자 경험의 중심으로 재배치하고 있습니다.

모바일 업계의 AI 전략 변화

  • 퀄컴(Qualcomm)은 차세대 Snapdragon 칩셋을 AI 퍼스트로 재설계하여, 클라우드를 거치지 않고 기기 자체에서 고급 AI 기능을 수행할 수 있도록 성능을 대폭 강화하고 있습니다. Snapdragon 8 Gen 3 칩셋은 생성형 AI 모델을 칩 내부에서 직접 구동하여, 기존에 클라우드로 보내 처리하던 작업들을 실시간 처리할 수 있게 합니다. 이 칩은 Meta의 Llama 2로 학습된 챗봇을 텍스트·이미지·음성 입력으로 받아들이고, Stable Diffusion과 같은 이미지 생성도 1초 이내에 완료하는 등 뛰어난 성능을 보여줍니다.
  • 애플은 자사 기기에 특화된 Neural Engine과 소규모 사설 모델을 활용해 온디바이스 AI 전략을 강화하고 있습니다. 애플은 거대 언어 모델의 보편화된 접근 대신, 특정 작업에 맞게 설계된 소형 모델들을 기기에 직접 내장하는 방식을 택했습니다. 이러한 맞춤형 경량 모델은 이메일 작성이나 사진 편집 등의 작업에 필요한 데이터셋을 사내에서 구축해 훈련되며, 인터넷 연결 없이도 아이폰 내부에서 대부분의 AI 기능이 동작합니다.
  • 삼성전자 역시 자체 경량 언어 모델(sLM) 개발에 박차를 가하며 글로벌 AI 경쟁에 뛰어들고 있습니다. 삼성종합기술원(SAIT)은 최근 매개변수 7백만 개 규모의 초소형 AI 모델을 공개했는데, 이는 일반적인 거대언어모델(LLM)의 1만 분의 1 크기에 불과하지만 추론 지능 평가에서 더 높은 정확도를 입증했습니다 이 초소형 TRM(Tiny Recursive Model)은 스스로 답을 비판·수정하는 반복적 사고(self-refinement) 과정을 통해, 구글 Gemini 2.5 모델보다도 높은 성능을 보여주었습니다.

스마트폰의 실시간 온디바이스 AI

이러한 흐름 속에서 2026년부터 출시될 스마트폰에서는 데이터센터를 거치지 않고 기기 내부에서 AI 기능을 실시간 실행하는 모습이 일반화될 전망입니다. 실제로 차세대 모바일 프로세서들은 더 큰 AI 모델도 휴대폰 안에서 돌릴 수 있도록 급속히 발전하고 있습니다. 2025년에 공개된 스냅드래곤 8 Gen 5 칩셋은 기존 세대보다 진일보한 INT2 정밀도 연산을 지원하여, 스마트폰이 이전보다 훨씬 대용량의 AI 모델을 구동할 수 있게 되었습니다. 이는 2023년에 INT4 연산 도입으로 온디바이스 AI의 분수령을 만든 이후 불과 몇 년 만의 진전으로, 양자화(quantization) 기술을 극한까지 활용해 10억~100억 개 규모의 파라미터를 가진 모델도 휴대기기에서 돌릴 수 있는 시대를 열고 있습니다. 그 결과 차세대 스마트폰은 복잡한 자연어 처리, 이미지 생성, 음성 비서 등의AI 기능을 클라우드 도움 없이도 즉각 수행하여, 사용자에게 앱 실행 수준의 지연도 느끼지 않는 매끄러운 AI 경험을 제공할 것으로 기대됩니다.

스마트 글래스: 차세대 플랫폼 전쟁의 개막

온디바이스 AI의 또 다른 축의 변화로 떠오른 것이 바로 스마트 글래스입니다. 한때 실험적인 가젯 정도로 여겨졌던 스마트 글래스가 이제 거대 기술 기업들의 차세대 플랫폼 전쟁터로 부상하고 있습니다.

  • 메타는 Ray-Ban Display Glasses를 출시하며, 사실상 스마트폰 이후의 차세대 플랫폼을 선언했습니다. 마크 저커버그 메타 CEO는 이 새로운 스마트안경을 소개하며“안경이야말로 개인형 초지능을 실현하기 위한 이상적인 폼팩터”라고 언급했는데 이는 사용자들이 현실 세계에 몰입한 상태에서 각종 AI 능력을 실시간 활용하도록 해주는 기기가 바로 안경이라는 뜻입니다. 실제로 Ray-Ban Display 안경은 오른쪽 렌즈에 작은 디스플레이를 내장하여, 알림 확인, 메시지 응답, 길안내 같은 기본 작업들을 휴대폰을 꺼내지 않고도 눈앞에서 처리할 수 있게 해줍니다.
  • 애플은 2027년 출시를 목표로 코드명 ‘N50’ AI 안경 개발에 속도를 내고 있습니다. 최근 보도에 따르면 애플은 원래 계획했던 Vision Pro 헤드셋의 경량화 버전 개발을 미루고, 엔지니어들을 N50 스마트안경 프로젝트로 대거 전환 배치했다고 합니다. N50 안경 1세대는 자체 디스플레이 없이 아이폰과 연동되어 동작하는 형태로 구상되었으며, 2026년 공개 후 2027년경 정식 출시를 목표로 하고 있습니다. 2세대 모델에서는 디스플레이가 탑재될 예정인데, 애플은 이 제품을 메타의 Ray-Ban Display에 맞먹는 혁신적 플랫폼으로 가꾸기 위해 개발을 가속하고 있다고 알려졌습니다.

분산형 온디바이스 AI의 부상

온디바이스 AI는 기기 내부에 국한되지 않고 여러 디바이스에 분산되어 협력하는 방향으로도 발전하고 있다는 점입니다. 이를테면 스마트폰, 스마트워치, 스마트안경 등이 상호 연동되어 AI 연산 작업을 분담하는 분산형 온디바이스 AI 시나리오가 부상 중입니다. 예를 들어 퀄컴은 스마트폰과 PC뿐 아니라 웨어러블 기기와 스마트안경까지 아우르는 “분산 추론(distributed inferencing)” 구조를 제시하고 있는데, 각 기기의 센서와 프로세싱 자원을 조합해 하나의 AI 서비스를 구현하는 개념입니다 이러한 접근법을 통해 사용자는 디바이스들의 협업으로 최적화된 AI 서비스를 누리되, 민감한 데이터는 여전히 손끝의 기기들에 로컬 저장되므로 보안이 강화됩니다.

클라우드 의존을 줄이면서도 개인정보 보호와 실시간 응답 속도를 모두 잡는 이 방식은 기술적 난이도가 있지만, 구현된다면 이상적인 형태의 AI 서비스라 할 수 있습니다. 예를 들어 사용자의 건강 모니터링을 생각해보면, 스마트워치가 바이탈 데이터를 감지하고, 스마트안경이 사용자의 주변 환경을 인식하며, 스마트폰이 종합적인 AI 분석을 수행해 조언을 제공하는 식입니다. 모든 연산은 사용자 주변 기기들에서 분산 수행되므로 네트워크 지연 없이 곧바로 피드백을 주며, 개인 데이터가 외부 서버에 덜 의존하니 프라이버시 우려도 최소화됩니다. 이러한 엣지AI 디바이스 간 분산협력은, 향후 사물인터넷(IoT) 시대에 AI 비서가 집안의 여러 기기들에 퍼져 동작하는 그림과도 연결되며, AI 활용의 범위를 클라우드 중심에서 사용자 환경 중심으로 재편하는 핵심 기술로 떠오르고 있습니다.

운영체제에 스며든 AI 등장

2026년 AI는 더 이상 앱 속의 하나의 기능이 아니라, 스마트폰 운영체제(OS)에 흡수될 것입니다. 이미 업계에서는 “AI가 새로운 UI”라는 표현이 나올 정도로, AI가 OS 전반의 인터페이스와 기능을 재정의하고 있습니다. 별도 앱을 실행하지 않아도, 운영체제 수준에서 사용자의 맥락을 이해하고 대응하는 에이전트형 AI가 스마트폰의 표준 기능이 될 것입니다. 이는 마치 스마트폰에 카메라나 GPS가 기본 내장되어 우리의 생활 방식을 바꿔놓았듯, AI도 자연스럽게 디지털 UX의 바탕을 이루게 됨을 의미합니다.

동시에, 스마트안경의 부상은 스마트폰 일변도의 개인 디바이스 지형에 커다란 변화를 예고합니다. 스마트폰이 지난 10여 년간 개인 컴퓨팅의 허브였다면, 앞으로는 AI로 강화된 AR 안경이 그 위치를 위협할 최초의 진지한 도전자가 될 것입니다. 실제로 AR 업계 전문가들은 증강현실(AR) 글래스와 주변컴퓨팅 기술이 머지않아 스마트폰과 PC를 대체하거나 크게 보완할 것으로 내다보고 있습니다.

이러한 변화들은 단순한 제품 트렌드가 아니라 컴퓨팅 패러다임의 전환점으로 여겨집니다. 2026년에는 본격적으로 클라우드와 디바이스의 경계가 흐려진 AI 경험과, 현실과 가상이 융합된 새로운 플랫폼이 펼쳐질 것으로 보입니다. 기존의 중앙집중형 방식인 클라우드에서 엣지로의 이동은 궁극적으로 사용자 중심의 AI를 실현함으로써 기술이 우리 삶에 스며드는 방식을 근본적으로 바꿀 것입니다.

글: 투이컨설팅 디지털 연구소