삼성 제미나이 라이브, 시각 AI 시장을 바꾸는 게임체인저 될까?
제미나이 라이브, 보고 말하는 AI 시대를 여는 삼성의 한 수
2025년 4월, 삼성전자가 AI 시장에 의미 있는 변화를 알렸다. 구글의 최신 대규모 언어모델(LLM) ‘제미나이(Gemini)’와 삼성의 하드웨어 기술이 결합된 ‘제미나이 라이브(Gemini Live)’가 처음 공개된 것이다. 이 기술은 단순한 음성 명령 기반의 AI를 넘어, 카메라로 본 장면을 실시간으로 분석하고, 이해하며, 반응하는 ‘시각 AI’
① 제미나이 라이브는 무엇인가?
‘제미나이 라이브’는 구글의 제미나이 AI와 삼성 디바이스 간의 긴밀한 통합을 통해 구현된 기능이다. 가장 큰 특징은 카메라 입력에 대한 실시간 맥락 인식. 예를 들어 사용자가 건물, 책, 간판, 음식, 사람 등을 비추면 AI가 자동으로 관련 정보를 제공하거나 번역, 비교, 분석 등의 기능을 수행한다.
이전의 AI는 사용자의 질문을 기다려야 했지만, 제미나이 라이브는 ‘먼저 알아채고 먼저 도와준다’는 능동형 UX로 진화한 점이 핵심이다. 이는 시각 중심 UX로 전환하려는 글로벌 흐름과도 맥을 같이 한다.
② 삼성과 구글의 전략적 협업: 하드웨어와 AI 알고리즘의 결합
삼성은 제미나이 라이브를 자사 갤럭시 기기(스마트폰, 태블릿, 웨어러블) 등과 결합해, AI 기능의 일상 속 확산을 노리고 있다. 반면 구글은 자사의 고성능 AI 모델을 실제 하드웨어 사용자 경험에 녹여내는 데 삼성의 전 세계 유통망과 하드웨어 최적화 기술을 활용한다.
이 협업은 단순한 API 연결 수준을 넘어서, 하드웨어 성능(카메라, NPU, 배터리, 센서 등)을 최대한 활용한 AI 반응 최적화를 목표로 한다. 이는 구글 픽셀이나 애플의 시리와는 또 다른 차별점을 만들어낸다.
③ 사용자 관점에서 제미나이 라이브가 바꿔놓을 풍경
그렇다면 이 기술은 우리의 일상을 어떻게 바꿀 수 있을까?
- 쇼핑: 마트에서 상품을 비추면 가격 비교, 사용자 리뷰, 원산지 정보까지 실시간으로 확인
- 여행: 외국 간판을 카메라로 비추면 자동 번역 및 주변 관광지, 환전소 정보 제공
- 교육: 수학 문제를 비추면 풀이 과정 영상 제공, 역사 교과서를 비추면 배경 설명 출력
- 헬스케어: 음식의 영양정보나 운동 자세 분석 등 개인 건강관리 영역으로 확장 가능
기존에는 직접 입력하거나 앱을 열어야 했던 정보 탐색을, 이제는 ‘그냥 보는 것만으로도’ AI가 먼저 반응하는 방식으로 바뀌는 것이다.
④ 시장 반응과 경쟁사 비교
이 기술 발표 직후, 업계 전문가들은 “삼성전자가 AI 트렌드에서 단순 탑승자가 아니라 기술 주도권을 쥐려는 시도”라고 평가하고 있다. 애플의 시리, 아마존 알렉사, 기존의 구글 어시스턴트 등은 대부분 음성 중심의 인터페이스였다면, 삼성은 시각 중심의 능동형 AI로 ‘다음 단계’를 선보인 것이다.
또한, AI 카메라 분야에서 중국계 기업(샤오미, 화웨이)과의 기술 격차도 벌어질 가능성이 있다. 이미 구글과 협업을 통해 LLM을 탑재한 삼성은, 자체 AP칩(NPU)과 결합된 시각처리 시스템으로 차별화된 생태계를 구축 중이다.
⑤ 기술적 과제: 실시간 AI의 한계와 해결 방향
물론 이 기술이 안고 있는 기술적 과제도 분명하다:
- 연산량 부담: 시각 인식 + 자연어 이해 + 실시간 피드백은 높은 NPU 처리 능력을 요구
- 배터리 소모: 실시간 카메라 입력과 AI 분석은 전력 소모가 크고 발열도 증가 가능
- 데이터 프라이버시: 사용자 주변 환경을 지속적으로 인식한다는 점에서 촬영 여부, 저장 방식에 대한 의구심 제기
삼성전자는 이에 대해 “온디바이스 AI 중심 처리, 데이터 로컬 저장, 사용 시점 제어 UI 탑재”를 통해 보안성과 사용자 신뢰를 확보하겠다는 입장을 내놨다. 실제로 어떤 방식으로 구현되는지, 이후 사용자 피드백을 기반으로 개선되는지가 관건이다.
⑥ 시각 AI 시대의 포문을 연 삼성, 그 다음은?
‘제미나이 라이브’는 단순히 새로운 기능이 아니라, AI가 인간과 더 직관적으로 소통할 수 있도록 진화하고 있다는 신호다. 카메라가 눈이 되고, AI가 뇌가 되며, 디바이스가 사람의 ‘두 번째 감각기관’이 되어가는 흐름 속에서, 삼성은 그 선두에 서고 있다.
이 기술이 상용화될 때 우리는 정말 무엇을 ‘보는가’보다, ‘본 것을 어떻게 AI가 해석하는가’에 더 집중하게 될 것이다. 그리고 그 시대는, 바로 지금부터 시작되고 있다.