자비스 같은 인공지능 비서를 위해 필요한 10가지 기술

반응형



영화 아이언맨을 보면 슈트와 계속 대화하는 것을 볼 수 있죠.
슈트에 내장된 인공지능 프로그램인 자비스 (JARVIS) 와 대화하는 것입니다.
먼 미래의 기술 같으면서도 우리생활이 어느덧 매우 가까이 부분적으로 다가와 있는 기술입니다.
NUGU 나 클로바 시리 빅스비 등등 음성인식 기기와 앱은 이미 우리가 사용 중입니다.
이렇게 인공지능 비서 기술이 우리 생활에 많이 다가와 있는 상태인데요.




자비스처럼 뛰어난 인공지능 비서 서비스를 위해서 꼭 필요한 10가지 기술을 알아보겠습니다.

가트너는 개인 비서 로봇을 (Personal Assistant Robots)을 다음과 같이 정의하였습니다.
“개인이 사용하도록 설계 및 제작된 로봇으로, 사용자의 일상 생활과 업무를 지원하고,
가정 생활을 도우며, 집안에서 이뤄지는 반복적 업무를 대신하고, 경우에 따라 동반자 역할을 수행하기도 한다.
또 주어진 규칙이나 알고리즘에 기반에 자율적으로 업무를 수행한다.”

현재 PAR 제조사들은 각자 자사의 차세대 제품을 탑재할 새로운 기능을 개발하고 있습니다.
일부 디바이스 및 가전 제조사들은 로봇 도입을 통해 제품 포트폴리오를 확장하고 있습니다.
제조사들은 새로운 기능 개발과 제품 포트폴리오 확장을 위해 어떤 기술을 사용할 것이고
이런 기술을 어떻게 조합해서 사용자 경험을 향상시킬 것인지 등의고민을 하고 있습니다.
2020년에 개인비서 로봇을 구현하기 위해 필요한 10대 센싱 및 인공 지능(AI) 기술은 다음과 같습니다.

1. 컴퓨터 비전
컴퓨터 비전(Computer Vision, CV)은 실제 세계의 이미지와 비디오를 캡처, 처리, 분석해서
기계가 실제 세계로부터 의미있는 정보를 추출하도록 하는 프로세스를 말합니다.
지난 몇 년간 컴퓨터 비전의 개발에 딥러닝과 신경망, 빅데이터의 발전과 처리 기능 향상이 큰 역할을 했습니다.
컴퓨터 비전에는 개인 로봇의 유형에 따라 달리 적용될 수 있는 다양한 영역이 있습니다.
머신 비전, 안면 인식, 이미지 인식, 패턴 인식, 윤곽선 인식, 움직임 감지 등이며,
컴퓨터 비전은 3D 매핑 및 포지셔닝을 구현하는 기술로, 모바일 로봇이 복잡한 실내 환경을 탐색할 수 있도록 합니다.

2. 생체 인식/인증
생체 인증을 사용하면 사용자마다 다른 고유의 생물학적 특징에 기반한 인증을 할 수 있습니다.
생체 인증 방식은 지문 인식 기술, 손가락 정맥 인식 기술, 얼굴/홍채 인식, 음성 인식 등이 있습니다.
이들 기술 중 지문 인식 등과 같은 일부 기술은 이미 상용화되어 있는 상황 입니다.
생체 인증은 다른 인증 방식에 비해 보안성이 뛰어날뿐 아니라 인증 시간을 단축합니다.
또한 PAR이 가족구성원에게 맞춤형 서비스를 제공할 수 있도록 하는 기반 기술이기도 합니다.

3. 대화형 사용자 인터페이스
대화형 사용자 인터페이스(Conversational User Interface, CUI)는 음성이나 문자로 된
자연어를 기본 입력 정보로 사용해 인간과 기계의 상호작용이 이뤄지는 인터페이스 입니다.
인간이 하는 질문을 인식하고, 언어적/의미적으로 분석하고, 적절한 응답을 제공하는 기술입니다.
사용자가 쉬운 자연어를 사용함으로써 PAR 학습 곡선을 최소화하도록 돕고,
사용자의 언어를 통해 수집된 정보는 사용자가 원하는 바를 학습하거나 사용자의 감정을 감지하는데 사용됩니다.

4. 감성 AI
감성 AI는 스마트폰이나 웨어러블 등 일상적으로 사용되는 개인용 디바이스가 사람들의 감정 상태를 감지,
분석, 처리해 사용자의 의도를 파악하고 대응할 수 있게 합니다.
여기에는 지능형 시스템 개발이 포함되며 머신러닝에 기반하는 경우도 있습니다.
감정과 상태를 감지하는 것은 인간에 더욱 공감하는 방식으로 행동할 수 있게 하는 것 입니다.
이런 '감정적 기능'은 사용자와 PAR간의 의사소통과 상호작용을 향상시키는 중요한 요소입니다.

5. 음향 배경 분석
음향 배경 분석 (Acoustic Scenery Analysis)은 PAR이 오디오 분석을 통해 소음을 감지할
뿐만 아니라 소음 발생 방향과 양까지 파악하고, 의사소통과 행동 시 고려한다는 개념에 기반하고 있습니다.
PAR은 다양한 상황 속에서 여러 사람과 상호작용하기 때문에 지속적으로 변화하는 환경에서 활동합니다.
음향 배경 분석은 PAR이 반응과 상호작용 기능을 지속적으로 다듬어 나갈 수 있도록 맥락 정보를 제공합니다.

6. 촉각 센서
촉각 센서는 PAR이 사람과 상호작용할 때 촉각 데이터를 적용하고 조정할 수 있게 해주는 기능입니다.
시각 센서만으로 물체에 대한 충분한 정보를 생성할 수 없다고 생각하여 PAR가 물건을 잡을 때
이 촉각 센서가 매우 중요한 역할을 합니다.
촉각 센서의 유형은 용량식(capacitive), 저항식(resistive), 적외선식(infrared) 등 다양하며,
PAR이 물체의 표면, 온도, 무게 등 여러가지 특성에 대한 정보를 얻을 수 있게 해줍니다.

7. 위치 감지
위치 감지 기술은 사람, 사물의 위치를 추적해 디지털 물체를 물리적 세계와 연결하여
PAR이 다양한 애플리케이션에 사용될 수 있도록 합니다.
개인용 모바일 로봇은 클라우드나 메모리에 지도가 사전 탑재된 환경은 물론 정보가 주어지지 않은
환경에서도 안전하게 이동하고 부여 받은 과제를 수행할 수 있어야 합니다.
그렇기 때문에 로봇은 주변 환경을 지속적으로 매핑하고 파악해 현재 위치와 방향을 파악하고
목표 지점까지 이동할 수 있어야 합니다.
매핑과 현지화, 탐색은 모바일 개인 로봇에 필요한 세 가지 표준 작업입니다.


8. 자율 운동
자율적 운동은 운송, 제스처, 춤, 조작 등의 물리적 움직임을 포함한 PAR의
모든 동작을 수행, 제어, 결정하는 기능입니다.
자율적 운동 방식에 의한 인간과의 물리적 접촉과 상호작용은 PAR이 갖는 중
요한 고객 가치 중 하나이며, 사람과 상호작용하지 않도록 설계된 자율주행차의 개념과 구분됩니다.
하지만 자율주행차에 사용되는 AI와 학습 방식은 PAR의 이동성에도 중요한 역할을 합니다.


9. 엣지 AI
PAR은 다양한 시스템과 상호작용으로부터 사용자 개인이나 가족의 취향에 대한 데이터를 수집하고
통합함으로써 개별화된 경험과 대응을 가능하게 해 주는 AI를 내장하고 있습니다.
AI 기능과 분석은 클라우드 기반 프로세싱을 기반으로 했지만, 전적으로 클라우드 서버에서
실행되는 AI 프로세싱 모델이 모두 확장 가능한 것은 아닌 만큼 엣지 디바이스(Edge Device)나
PAR 제조사들에게 중단기적 기회가 형성되었 습니다.
최근에는 구성 요소와 프레임워크 분야에서 이뤄진 발전 덕분에 디바이스 AI의 사용이 가능하게 되었고
새로운 엣지 디바이스 AI 모델은 지연 시간으로 인해 발생하는 문제들을 해소해 보안을 향상시키고
개인정보보호 문제를 해결하며 고객 경험을 개선합니다.


10. 멀티모달 입력 통합
인간은 시각, 청각, 촉각, 물리적 충격 등 복수의 감각을 활용해 외부 환경을 인식합니다.
사람과 같이 다양한 유형의 데이터를 통합하는 멀티모달 입력은 PAR의 정확성, 효율성 제고에 기여하며,
인식과 인지에 있어서의 모호함을 줄여줄 뿐만 아니라, 행동, 반응, 대처를 위한 의사 결정 시 불확실성을 경감합니다.


반응형

이 글을 공유하기

댓글

Designed by JB FACTORY