ChatGPT 및 기타 대규모 언어 모델 기반은 이제 "중요한 것"이며 우리가 매일 수행하는 대부분의 활동을 디지털 방식으로 혁신할 것을 약속합니다 . 하지만 UX 전문가로서 우리의 초점은 사용자 이며 모든 혁신은 의도된 사용자에게 가치를 제공하고 문제를 해결해야 한다고 믿습니다 . 이 "가치" 개념은 제품이나 기술의 유용성과 혁신성을 결정하는 데 필수적입니다.
최근 UX 업계 뉴스에서는 디자인 목업을 위한 콘텐츠 생성, 사용자 연구(!) 수행, 매력적인 카피 생성과 같은 작업에 ChatGPT를 활용하는 경향이 있습니다. 이러한 발전은 디자이너의 경험과 생산성을 향상시킬 수 있지만 우리의 주요 관심사는 여전히 사용자 자신입니다. 우리는 ChatGPT 또는 유사한 기술의 구현이 사용자 경험을 진정으로 개선하고 사용자가 추구하는 가치에 더 가까워지도록 보장하고자 합니다.
책 "Innovare con il Design: Il Caso del Settore dell'Illuminazione in Italia"(F. Zurlo et al ., Paper, 2002)에서 "혁신" (in a product, artifact or interface, …)은 다음과 같이 정의됩니다. 기존 유사 제품과의 긍정적인 차이 . 이 델타는 주로 사용자 문제 해결을 기반으로 합니다. 이러한 유용성 속성은 제품, 기능, 기술이 혁신적임을 정의하는 기본 조건이라고 할 수 있습니다.. 분명히 순수한 연구 분야에는 사용자에게 즉각적인 영향을 미치지 않는 많은 혁신이 있지만, 수행된 모든 연구는 최종 단계에서 누군가의 문제를 해결해야 합니다. 그렇지 않으면 그 목적은 무엇입니까?
따라서 ChatGPT와 같은 기술에 관한 가장 중요한 질문은 다음과 같습니다.
ChatGPT 또는 이와 유사한 기술이 어떻게 (그리고 어디에서) 사용자 경험을 개선하고 사용자가 추구하는 가치 에 더 가까이 다가갈 수 있는 긍정적인 차이를 도입할 수 있습니까?
ChatGPT 및 인터페이스.
UX 전문가들이 가장 관심을 갖는 사용자 인터페이스 의 관점에서 구체적으로 살펴보면 다음과 같은 질문이 생깁니다. 기존 인터페이스 유형과 비교하여 ChatGPT가 가져올 수 있는 이점은 무엇입니까? 어떤 의미에서 그것을 혁신적이라고 정의할 수 있습니까?
ChatGPT는 대화형 인터페이스의 예를 나타냅니다. 대화형 인터페이스 "는 사람들이 실제 사람과 상호 작용하는 것처럼 소프트웨어, 앱 및 봇과 상호 작용할 수 있도록 합니다. 타이핑이나 말하기에 자연어를 사용하면 특정 작업을 쉽게 수행할 수 있습니다.” ( “ 대화형 인터페이스란 무엇입니까? ”에서 발췌, Zendesk 블로그의 Jesse Martin 작성).
마이크를 통해 랩톱 컴퓨터와 상호 작용하는 여성.
Prompthunt 에서 생성한 이미지 . "음성으로 컴퓨터와 상호 작용하는 인간". 말이된다.
이러한 인터페이스는 2000년대 초부터 두 가지 주요 형태로 존재했습니다.
챗봇: 일반적인 질문에 대한 사전 정의된 답변과 경로를 활용하며 문제 해결 및 고객 지원 시나리오에서 자주 사용됩니다.
음성 도우미: 사용자가 자연스러운 음성을 통해 인터페이스와 상호 작용할 수 있도록 하여 사전 정의된 일반적인 작업을 실행할 수 있습니다. "Alexa"와 같은 인기 있는 음성 비서가 등장하기 이전에도 초기 휴대폰에는 전화를 걸기 위한 음성 명령이 있었습니다. 오늘날 이러한 상호 작용 가능성은 최신 스마트 워치, 자동차 인포테인먼트 시스템 및 스마트 TV에 통합되어 있습니다.
대화형 인터페이스의 이전 응용 프로그램은 다소 제한적 이었고 종종 사용자에게 실망했지만 ChatGPT와 같은 기술은 이제 이러한 유형의 상호 작용을 다음 단계로 끌어올릴 것을 약속합니다. 사실 제한된 스크립트 접근 방식과 달리 ChatGPT는 실제 사람이 응답하는 방식과 유사하게 도메인 지식을 기반으로 응답을 생성할 수 있습니다. 대화 상호 작용이 크게 발전함에 따라 여전히 시각적 인터페이스가 필요합니까 ?
최근 기사 " AI는 60년 만에 처음으로 새로운 UI 패러다임 "이라는 기사에서 Jakub Nielsen은 ChatGPT 및 유사한 AI 기술에 의해 도입된 상호 작용을 최신 및 신흥 상호 작용 모델을 나타내는 "의도 기반 결과 사양" 으로 정의합니다. 이 모델에서 사용자는 원하는 결과를 얻기 위한 단계를 지정하지 않고 원하는 결과를 컴퓨터에 전달합니다. 이 접근 방식은 이메일 클라이언트, 온라인 뱅킹, 정보 웹사이트, 특수 클라우드 기반 소프트웨어, 소셜 네트워크 플랫폼, 인터넷 브라우저 및 검색 엔진을 포함한 디지털 애플리케이션의 전체 스펙트럼에 걸쳐 매우 강력하고 적용할 수 있습니다. 한편, 시각적 인터페이스는 두 번째 패러다임에 속하는 유형 중 하나로 분류됩니다."명령 기반 상호 작용 패러다임."
그렇다면 이러한 시스템을 작동하는 데 여전히 시각적 인터페이스가 필요할까요, 아니면 모든 것이 "대화"가 될까요?
사용자 인터페이스는 사용자와 기계 사이의 매개체 역할을 하며 인터페이스가 몰입감이 높을수록 사용자 친화적이 됩니다. 몰입형 인터페이스는 인간의 행동, 제스처, 상호 작용 패턴 및 정신 모델을 모방하여 인간이 자연스럽게 행동하는 방식과 일치하고 학습이 거의 또는 전혀 필요하지 않습니다. 즉각적이고 사용자 중심적이며 직관적인 경험을 제공합니다. ( 사용자가 기계와의 관계에서 관련 중단을 느끼지 않기 때문에 정확히 몰입형 으로 정의됩니다 . 동일한 환경의 일부인 것 같고 사용자는 시스템에 몰입한다고 느낍니다. 몰입 의 가장 좋은 예입니다.정의상 가상 현실이지만 이 개념은 사용자가 시스템에서 인식하는 "거리"를 줄이고 자연스럽게 느껴지도록 모든 인터페이스를 설명하는 데 적합합니다.
인터페이스 및 작업.
생각해 보면 시각적 인터페이스는 인간의 상호 작용을 모방하는 불완전한 방법으로 설계되었습니다. 우리는 모든 시각적 인터페이스를 사용자와 시스템 간의 이상적인 대화로 상상할 수 있습니다. 시스템은 사용자의 특정 입력이 필요하며 동시에 이러한 입력이 무엇인지, 시스템이 이해할 수 있도록 적절하게 형식을 지정하는 방법, 입력을 찾을 수 있는 위치, 입력의 용도 및 용도에 대한 지침과 설명을 제공합니다. 곧. 그런 다음 시스템은 사용자에게 예상되는 출력을 제공합니다.
이제 사용자가 일반적으로 디지털 방식 으로 수행하는 세 가지 작업을 살펴보겠습니다 .
1. 은행 계좌 개설:
이 작업은 복잡하며 사용자가 은행 웹사이트의 구조를 이해하고 프로세스를 시작하는 데 필요한 콘텐츠를 찾아야 합니다. 시스템에는 이름, 성 등과 같은 간단한 입력이 필요 하지만 업로드할 ID 카드 또는 기타 문서의 데이터와 같은 보다 복잡한 정보 도 필요합니다. 주의, 지식, 특정 문서, 때로는 자세한 조사를 요구하는 FATCA 또는 KYC 설문지에 대한 답변과 같은 매우 복잡한 입력이 필요할 수도 있습니다.
이는 고객이나 잠재 고객이 은행 계좌를 개설하기를 원하고 절차와 제공해야 하는 정보를 알고 있는 출납원과 상호 작용하는 실제 은행 지점에서의 대화와 크게 다르지 않습니다. 가치 있는 산출물(은행 계좌)은 결국 발행됩니다.
UX 디자인 전문가는 오늘날 "마법사" 또는 "안내 경로"라는 것을 사용하여 복잡한 작업을 더 작은 작업으로 나누고 사용자에게 필요한 입력을 단계별로 안내합니다. 마법사는 기본적으로 클라이언트 정보와 문서를 올바른 순서로 요청하는 디지털 버전의 지점 출납원입니다.
그러나 이 작업을 위해 ChatGPT 또는 다른 AI 기반 대화 인터페이스를 활용할 수 있다고 상상해 보십시오. 우리는 우리에게 필요한 것이 무엇인지 평이한 말로 물을 수 있고 시스템이 우리를 안내하도록 할 수 있습니다.
이러한 유형의 복잡한 작업에 마법사가 여전히 가장 효과적인 인터페이스일까요? AI 기반 상호 작용(대화형 인터페이스)이 때때로 인터페이스로서 더 잘 수행될 수 있지만 잘 설계된 마법사(시각적 인터페이스)는 여전히 이점이 있습니다.
2. 새로 개설된 계정의 거래 모니터링:
이 두 번째 시나리오에서는 은행 계좌의 잔고 추세, 저축한 금액, 가장 많이 지출한 일수, 이유 및 일반적인 지출 추세를 추적하려고 합니다.
ChatGPT는 이 작업에 대해 더 나은 인터페이스를 제공합니까? 아마 아닐 겁니다. 큰 그림을 비교하고 이해해야 하는 이와 같은 작업은 시각적 인터페이스, 그래프 및 다양한 해석을 허용하는 강력한 표현으로 더 잘 해결됩니다.
3. 버스 타기: 기본 정보 얻기:
우리가 출근 준비를 하고 있고 정류장에서 다음 버스 시간을 알고 싶어 한다고 상상해 봅시다. 현재 대중교통 웹사이트에서 시간표를 확인하거나 Google 지도와 같은 앱을 사용하는 등 여러 가지 방법으로 이 정보를 얻을 수 있습니다. 다시 한 번 대중 교통 앱을 사용하여 이 정보를 검색할 수 있습니다.
주변에 사람이 없는 시골의 안개 낀 날 버스 정류장을 보여주는 이미지.
Pexels 의 이미지 . 버스 도착 시간 검색 실패의 잠재적 영향.
ChatGPT가 현재 우리가 사용하는 인터페이스보다 성능이 더 좋을까요?
이 경우 ChatGPT는 일반 인터페이스보다 훨씬 더 많은 가치를 제공할 수 있습니다. 특정 질문에 대한 직접적인 답변을 제공 하고 정보 검색 작업을 수행하며 정확한 출력을 제공할 수 있습니다.
대화 vs 시각적, 언제 무엇을 사용할지, 언제 둘 다 사용할지.
이 세 가지 시나리오에서 우리는 다양한 유형의 사용자 작업이 Chat GPT 및 기타 AI 시스템과 같은 대화형 상호 작용에서 어떤 이점을 얻을 수 있는지 또는 그렇지 않을 수 있는지 확인했습니다. 일반화하려고 하면 다음과 같이 말할 수 있습니다.
설정, 온보딩, 구성과 같은 작업 과 시스템에서 이해하고 소화하기 어려운 복잡하고 구조화된 입력이 필요할 때마다 우수한 대화형 인터페이스가 도움이 됩니다.
그러나 복잡한 출력을 해석 해야 하는 작업 (예: 트렌드를 파악하고 결정을 내리기 위한 그래프 관찰, 이메일 확인, 소셜 네트워크 피드 모니터링)에는 여전히 우수한 UX 디자인 원칙을 갖춘 시각적 인터페이스가 필요합니다.
궁극적으로 버스 도착 시간을 알고, 내일 비가 올지 확인하거나, 검색 엔진을 통해 특정 정보를 검색하는 등 정확하고 제한된 출력이 필요한 작업은 ChatGPT에서 처리할 때 훨씬 더 잘 작동 합니다 . 실제 사람을 모방하고 원하는 정보에 대한 사용자의 경로를 훨씬 더 짧게 만들 수 있습니다.
작업 해결과 관련된 입력 및 출력의 양을 고려하면 다음과 같이 요약할 수 있습니다.
많은 양의 입력이 필요합니다. 대화형 인터페이스가 더 잘 작동합니다.
적은 양의 입력 필요(또는 매우 명확한 순서): 시각적 인터페이스가 더 잘 작동합니다.
많은 양의 출력 생성: 시각적 인터페이스가 더 잘 작동합니다.
적은 양의 출력 생성: 대화형 인터페이스가 더 잘 작동합니다.
필요한 입력의 수량 및 복잡성과 상호 작용 모델이 더 효과적인 제공된 출력을 보여주는 다이어그램.
Miro 로 만든 원본 이미지 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
대화형 인터페이스와 시각적 인터페이스는 각각의 강점을 활용하여 사용자 경험을 향상시키기 위해 공존 할 수 있고 공존 해야 한다는 점도 언급할 가치가 있습니다.
은행 계좌 개설의 맥락을 다시 생각해 봅시다.
은행 웹사이트에서 계좌 개설 옵션을 검색하는 대신 대화형 인터페이스를 통해 계좌 개설 의사를 직접 밝히는 것이 더 몰입할 수 있습니다.
은행 사이트 인터페이스의 와이어프레임: "오늘 SUPERBank가 어떻게 도와드릴까요?"라는 텍스트 상자가 있는 홈페이지.
소프트웨어 Figma 와 André Moura의 라이브러리 Wireframe Kit 로 만든 원본 와이어프레임 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
우리의 필요와 예산에 가장 적합한 계정을 선택할 때 시각적 인터페이스가 비교 및 분석을 가능하게 하기 때문에 대화형 인터페이스를 능가합니다.
은행 사이트 인터페이스의 와이어프레임: 계정 선택, 세 가지 옵션.
소프트웨어 Figma 와 André Moura의 라이브러리 Wireframe Kit 로 만든 원본 와이어프레임 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
프로세스가 시작되면 마법사 인터페이스가 특히 간단한 입력을 수집하는 데 가장 효율적인 것으로 입증되었습니다.
은행 사이트 인터페이스의 와이어프레임: 계정 구성, 개인 데이터 수집.
소프트웨어 Figma 와 André Moura의 라이브러리 Wireframe Kit 로 만든 원본 와이어프레임 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
그러나 상황이 더 복잡해지면 "인간화된" 지원을 제공하면 사용 편의성이 크게 향상될 수 있습니다.
은행 사이트 인터페이스의 와이어프레임: 계정 구성, 문서 수집.
소프트웨어 Figma 와 André Moura의 라이브러리 Wireframe Kit 로 만든 원본 와이어프레임 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
재무를 모니터링해야 할 때 시각적 인터페이스를 통해 표시되는 시각적 그래프는 완벽한 표현을 제공하여 다시 빠른 비교 및 분석을 가능하게 합니다.
은행 사이트 인터페이스의 와이어프레임: 지출 추세를 보여주는 계정 페이지.
소프트웨어 Figma 와 André Moura의 라이브러리 Wireframe Kit 로 만든 원본 와이어프레임 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
그러나 구체적인 질문이 있을 때 LLM 인공 지능(대화형 인터페이스로 표시됨)을 이길 수 있는 것은 없습니다.
은행 사이트 인터페이스의 와이어프레임: 지출 추세를 보여주는 계정 페이지와 왼쪽의 대화형 인터페이스.
소프트웨어 Figma 와 André Moura의 라이브러리 Wireframe Kit 로 만든 원본 와이어프레임 . 출처(이 기사 및/또는 내 이름 및 내 Linkedin 프로필 에 대한 링크 )에 적절한 귀속이 제공되는 경우 승인 없이 사용할 수 있습니다.
결론
ChatGPT 및 LLM의 잠재력을 완전히 이해하기에는 아직 이르며 이러한 기술을 실험하고 탐색하는 것이 중요합니다. 이 간단한 에세이가 UX 및 제품 전문가가 사용자 인터페이스 디자인에 이러한 기술을 언제 어디서 효과적으로 활용하여 사용자에게 진정한 가치를 제공할지 결정하는 데 유용할 수 있기를 바랍니다 . 이러한 기술을 기존의 시각적 인터페이스와 결합하는 방법을 이해 하고 작업 유형과 필요한 입력 및 생성된 출력을 기반으로 어떤 접근 방식이 가장 적합한지 결정하는 데 도움이 됩니다.
다시 한 번 J. Nielsen의 말을 인용하자면, “미래의 AI 시스템 은 여전히 많은 GUI 요소를 유지하면서 의도 기반 인터페이스와 명령 기반 인터페이스의 요소를 결합하는 하이브리드 사용자 인터페이스를 갖게 될 것입니다 .”
이제 가장 큰 UX 과제는 이러한 하이브리드 경험을 적절하게 설계하는 방법을 이해하는 데 있습니다.