음성 사용자 인터페이스(VUI)는 사용자가 음성 명령을 사용하여 Amazon Alexa 및 Google Home과 같은 장치와 상호 작용할 수 있도록 하여 빠르게 인기를 얻고 있습니다. VUI는 타이핑이나 클릭과 같은 전통적인 입력 방법이 아닌 음성이나 음성을 통해 컴퓨터나 장치와 통신할 수 있는 사용자 인터페이스 유형입니다. 더 많은 사람들이 음성 인식 기술을 채택함에 따라 UX 전문가는 사용자의 요구와 기대에 부응하는 매력적이고 직관적인 VUI를 만드는 데 새로운 과제에 직면하게 되었습니다.
음성 상호 작용을 위한 디자인은 기존의 시각적 인터페이스 디자인에서 크게 벗어났습니다. 많은 디자이너는 사용자를 안내하고 정보를 효과적으로 전달하기 위해 그래픽 요소, 레이아웃 및 시각적 계층 구조에 크게 의존합니다. 그러나 VUI를 디자인할 때 이러한 시각적 단서가 없기 때문에 디자이너는 효과적인 사용자 경험을 만들기 위해 소리, 톤, 대화 흐름에 집중해야 합니다.
ChatGPT와 같은 고급 언어 모델의 출현으로 VUI에 대한 새로운 가능성이 열리면서 보다 자연스럽고 인간과 유사한 대화가 가능해졌습니다. 이러한 AI 기반 비서는 상황을 이해하고 관련 응답을 제공하며 개방형 대화에 참여할 수 있습니다. 음성 기술이 계속 발전함에 따라 우리는 기능적이고 감정적으로 매력적이며 신뢰할 수 있는 VUI를 만들기 위해 기술과 지식을 조정하여 일상 생활에서 기술과 상호 작용하는 방식을 재구성해야 합니다.
r/ChatGPT - '그녀'가 나를 고칠 거예요
최신 ChatGPT-4o 음성 지원 기능 공개에 대한 반응으로 나온 Meme
음성 상호 작용의 특성 이해
음성 상호 작용은 다음과 같은 몇 가지 주요 측면에서 기존 그래픽 사용자 인터페이스(GUI) 상호 작용과 다릅니다.
선형 및 일시적: 음성 상호 작용은 선형적이고 일시적입니다. 즉, 사용자는 한 번에 하나의 정보만 처리할 수 있으며 시각적 인터페이스와 달리 이전 정보를 쉽게 다시 참조할 수 없습니다( Murad et al., 2018 ). GUI에서 사용자는 화면을 스캔하여 필요한 정보를 빠르게 찾을 수 있지만 VUI에서는 대화를 탐색하기 위해 메모리와 시스템의 프롬프트에 의존해야 합니다.
시각적 단서 부족: 시각적 단서가 없으면 사용자는 인터페이스를 탐색하기 위해 청각 피드백과 기억에 의존해야 하므로 인지 부하가 증가할 수 있습니다. GUI에서 디자이너는 버튼, 메뉴, 아이콘과 같은 시각적 요소를 사용하여 사용자를 안내하고 상호 작용을 위한 어포던스를 제공합니다. VUI에서 디자이너는 사운드 디자인, 음성 프롬프트 및 대화 흐름을 사용하여 사용자를 안내하고 사용 가능한 작업을 전달해야 합니다.
자연어: 사용자는 모호하고 상황에 따라 달라질 수 있는 자연어를 사용하여 VUI와 상호 작용합니다. 디자이너는 사용자가 자신을 표현하는 방식의 다양성을 고려해야 합니다( Pearl, 2016 ). 사용자가 미리 정의된 제한된 컨트롤 세트와 상호 작용하는 GUI와 달리 VUI는 다양한 문구, 악센트 및 언어 스타일을 포함하여 광범위한 사용자 발화를 이해하고 응답할 수 있어야 합니다. 아래의 악명 높은 스코틀랜드 엘리베이터 스케치는 이러한 과제 중 일부를 보여줍니다.
비가시성: VUI는 보이지 않습니다. 즉, 사용자는 사용 가능한 옵션이나 시스템 기능을 한눈에 볼 수 없습니다( Yankelovich et al., 1995 ). GUI에서 사용자는 메뉴를 탐색하고 버튼을 클릭하여 인터페이스를 탐색하고 새로운 기능을 발견할 수 있습니다. VUI에서 사용자는 시스템의 프롬프트와 시스템이 새로운 기능을 발견하기 위해 수행할 수 있는 작업에 대한 자신의 정신적 모델에 의존해야 합니다.
이러한 고유한 특성에 맞게 디자인하려면 사용자 요구, 기대 및 정신 모델에 대한 깊은 이해가 필요합니다. 디자이너는 자연어를 사용하여 시스템과 어떻게 상호 작용할 수 있는지 예측해야 합니다. 이를 위해서는 시각적 디자인에서 대화형 디자인으로 사고의 전환이 필요하며 대화의 흐름, 프롬프트의 명확성 및 응답의 자연성에 중점을 둡니다.
효과적인 VUI 디자인을 위한 모범 사례
VUI를 디자인할 때 사용자의 요구 사항, 요구 사항 및 VUI를 사용하게 될 상황을 이해하는 것부터 시작하는 것이 중요합니다. 이는 사용자의 주변 환경, 달성하려는 목표 및 직면할 수 있는 모든 제약 사항을 인정하는 것을 수반합니다. 이를 달성하기 위해서는 사용자 조사를 수행하는 것이 중요합니다.
VUI를 디자인할 때 염두에 두어야 할 몇 가지 다른 사례는 다음과 같습니다.
대화 흐름을 위한 설계: 인간 대 인간의 상호 작용을 모방하는 자연스럽고 직관적인 대화 흐름을 만듭니다. 원활한 의사소통을 보장하기 위해 순서대로 진행, 피드백 및 수리 전략의 원칙을 사용하십시오. 예를 들어, 시스템은 사용자가 말할 차례가 되면 명확한 신호를 제공해야 하며 중단 및 앞뒤 교환을 우아하게 처리할 수 있어야 합니다.
간단하고 집중적인 상호 작용 유지: 사용자는 VUI와의 짧고 집중적인 상호 작용을 선호합니다. 복잡한 작업을 더 작고 관리 가능한 단계로 나누고 명확하고 간결한 프롬프트를 제공하여 간결하게 디자인하세요. 예를 들어, 사용자에게 긴 옵션 목록을 제시하는 대신 작업을 안내하는 일련의 짧고 구체적인 질문을 하세요.
명확한 피드백 및 확인 제공: 사용자가 시스템이 수행하는 작업과 사용자에게 기대되는 작업을 항상 알 수 있도록 합니다. 투명성을 유지하고 신뢰를 구축하기 위해 명확한 피드백과 확인 메시지를 제공하세요. 예를 들어, 사용자가 요청한 후 시스템은 들은 내용을 확인하고 작업 상태에 대한 업데이트를 제공해야 합니다. 이를 달성하기 위해 시각적 신호와 특정 소리를 사용할 수도 있습니다.
오류를 적절하게 처리합니다. 잠재적인 사용자 오류를 예측하고 사용자에게 오류를 복구할 수 있는 방법을 제공합니다. 점진적 공개를 사용하여 사용자를 원래 궤도로 되돌리도록 안내하고 대체 조치를 제안하는 유용한 오류 메시지를 제공합니다. 예를 들어, 사용자가 모호한 요청을 하는 경우 시스템은 설명을 요청하고 사용자가 말할 수 있는 내용에 대한 예를 제공해야 합니다.
핸즈프리 및 눈이 없는 상호 작용에 맞게 최적화: 사용자가 멀티 태스킹을 하거나 시각적 주의가 제한되는 시나리오를 위한 디자인입니다. 시각적 피드백이나 수동 입력 없이 VUI를 효과적으로 사용할 수 있는지 확인합니다( Porcheron et al., 2018 ). 예를 들어, 음성으로 제어되는 요리 도우미는 사용자가 화면을 보거나 손을 사용할 필요 없이 조리법을 단계별로 안내할 수 있어야 합니다.
음성 비서의 예, Home Connect .
경험 개인화: 사용자 데이터와 컨텍스트를 활용하여 개인화된 상호 작용을 제공합니다. 자연어 처리 및 기계 학습을 사용하여 시간이 지남에 따라 사용자 선호도와 행동에 적응합니다. 예를 들어, 음성 제어 음악 플레이어는 사용자가 좋아하는 장르와 아티스트를 학습하고 청취 기록을 기반으로 개인화된 추천을 제공할 수 있어야 합니다.
단순성과 명확성을 우선시합니다. 전문 용어와 복잡한 언어를 피하는 것은 다양한 기술 숙련도를 가진 사용자가 인터페이스와 쉽게 상호 작용할 수 있도록 하는 방법입니다. 예를 들어, "주 생활 공간의 조명을 활성화하려면 '거실 조명 시작'이라는 명령을 말로 표현하는 대신 '거실 조명을 켜려면 '거실 조명을 켜세요'라고 말하세요."와 같은 간단한 명령을 선택하세요. '"
효율성과 검색 가능성의 균형: 사용자는 상호 작용이 빠르고 효율적이기를 원하지만 새로운 기능을 발견할 수도 있어야 합니다. 점진적인 공개, 상황별 제안, 사용자 친화적인 온보딩 및 튜토리얼과 같은 여러 전략이 이러한 균형을 유지하는 데 도움이 될 수 있습니다.
개인 정보 보호 문제 해결
VUI 사용과 관련하여 사용자가 종종 우려하는 부분은 개인 정보 보호에 미치는 영향입니다. 음성 기반 시스템은 항상 듣고 있으며 잠재적으로 민감한 데이터를 수집할 수 있습니다. 이러한 문제를 해결하려고 노력하는 것이 중요합니다. 몇 가지 제안 사항은 다음과 같습니다.
데이터 수집 및 사용에 대한 투명성 확보: 수집되는 데이터, 사용 방법, 사용자가 개인정보 설정을 제어할 수 있는 방법을 명확하게 전달합니다( Easwara Moorthy & Vu, 2015 ). 예를 들어, 음성 제어 스마트 스피커는 수집하는 데이터에 대한 명확한 정보를 제공하고 사용자에게 데이터 수집을 거부하거나 음성 녹음을 삭제할 수 있는 기능을 제공해야 합니다.
개인 정보 보호 제어 제공: 사용자에게 자신의 데이터에 대한 제어권을 부여하고 필요에 따라 데이터를 삭제하거나 수정할 수 있는 기능을 제공합니다( Cho, 2019 ). 예를 들어, 음성 제어 가상 비서는 사용자가 대화 기록을 검토 및 삭제할 수 있도록 하고 수집되는 데이터 유형에 대한 세부적인 제어 기능을 제공해야 합니다.
안전한 데이터 관행 구현: 사용자 데이터가 안전하게 저장 및 전송되는지 확인하고 데이터 보호 및 개인정보 보호에 대한 모범 사례를 따릅니다( Cho, 2019 ). 여기에는 무단 액세스나 침해로부터 사용자 데이터를 보호하기 위한 암호화, 보안 인증, 정기적인 보안 감사 사용이 포함됩니다.
결론
VUI를 디자인하려면 음성 상호 작용의 고유한 측면을 고려한 사용자 중심 접근 방식이 필요합니다. 대화형 디자인의 모범 사례를 준수하고 개인 정보 보호 문제를 해결함으로써 사용자 요구와 기대를 충족하는 매력적이고 효과적인 VUI를 개발할 수 있습니다.