Microsoft’s Accessibility Innovation Strategist discusses AI’s potential for accessibility, emphasizing the need for responsible use and diverse teams to mitigate harm and promote inclu…
마이크로소프트의 접근성 혁신 전략가는 AI의 접근성에 대한 잠재력을 논의하면서 책임 있는 사용과 피해를 완화하고 촉진하기 위한 다양한 팀의 필요성을 강조한다…
요약 :)
다른 도구와 마찬가지로 AI는 매우 건설적이고 포괄적이며 접근 가능한 방식으로 사용될 수 있습니다.
AI와 접근성의 교차점에 대한 Joe Dolson의 최근 글을 읽으면서 나는 그가 AI 전반에 대해 가지고 있는 회의론과 많은 사람들이 AI를 사용하는 방식에 대해 절대적으로 감사했습니다. 사실 저는 Microsoft에서 접근성 혁신 전략가로서 AI for Accessibility 보조금 프로그램 운영을 돕는 역할을 하고 있음에도 불구하고 AI에 대해 매우 회의적입니다. 다른 도구와 마찬가지로 AI는 매우 건설적이고 포괄적이며 접근 가능한 방식으로 사용될 수 있습니다. 파괴적이고 배타적이며 해로운 것에도 사용될 수 있습니다. 그리고 평범한 중간 어딘가에도 수많은 용도가 있습니다.
기사는 아래에서 계속됩니다댓글 4개
이 공유:
Facebook에 공유하려면 클릭하세요(새 창에서 열림)
트위터에 공유하려면 클릭하세요(새 창에서 열림)
후원자가 되세요
노스웨스턴 로고
정보 디자인 및 전략 분야 노스웨스턴 온라인 석사. 콘텐츠 전략, UX/UI, 데이터 커뮤니케이션, 학습 디자인 트랙 중에서 선택하세요.
책 아파트 로고
A Book Apart:
웹사이트를 만드는 사람들을 위한 간략한 책입니다.
Joe의 게시물을 보완하기 위해 이 부분을 "예… 그리고" 부분으로 간주하시기 바랍니다. 나는 그의 말을 반박하려는 것이 아니라 AI가 장애인에게 의미 있는 변화를 가져올 수 있는 프로젝트와 기회에 대한 가시성을 제공하려는 것입니다. 분명히 말하면, AI에 해결해야 할 실질적인 위험이나 시급한 문제가 없다고 말하는 것은 아닙니다. 어제처럼 문제를 해결해야 했지만, 조금 더 이야기하고 싶습니다. 언젠가는 거기에 도달할 수 있기를 바라면서 무엇이 가능한지에 대해 이야기할 시간입니다.
대체 텍스트
Joe의 작품은 대체 텍스트를 생성하는 컴퓨터 비전 모델에 대해 이야기하는 데 많은 시간을 소비합니다. 그는 현재 상황에 대한 수많은 유효한 문제를 강조합니다. 그리고 컴퓨터 비전 모델은 설명의 품질과 세부 묘사의 풍부함 측면에서 계속해서 향상되고 있지만 결과는 좋지 않습니다. 그가 올바르게 지적했듯이, 현재 이미지 분석 상태는 특히 특정 이미지 유형의 경우 매우 열악합니다. 왜냐하면 현재 AI 시스템은 이미지가 속한 컨텍스트 내에서가 아니라 이미지를 개별적으로 검사하기 때문입니다. 텍스트 분석과 이미지 분석을 위한 별도의 "기반" 모델) 오늘날의 모델은 상황에 맞는 이미지(설명이 있어야 함)와 순전히 장식적인 이미지(설명이 필요하지 않음)를 구별하도록 훈련되지 않았습니다. 그래도 저는 이 분야에 아직 가능성이 있다고 생각해요.
Joe가 언급했듯이 인간이 직접 대체 텍스트를 작성하는 것이 반드시 필요합니다. 그리고 AI가 대체 텍스트의 시작점을 제공하기 위해 갑자기 나타날 수 있다면, 비록 그 시작점이 이 BS가 무엇입니까?라는 메시지일 수도 있습니다. 전혀 옳지 않습니다… 출발점을 제시해 보겠습니다. 제 생각에는 그것이 승리라고 생각합니다.
한 단계 더 나아가 상황에 맞게 이미지 사용을 분석하도록 모델을 구체적으로 훈련할 수 있다면 어떤 이미지가 장식용일지, 어떤 이미지에 설명이 필요할지 더 빠르게 식별하는 데 도움이 될 수 있습니다. 이는 이미지 설명이 필요한 컨텍스트를 강화하는 데 도움이 되며 페이지의 접근성을 높이는 데 있어 작성자의 효율성을 향상시킬 것입니다 .
그래프나 차트와 같은 복잡한 이미지는 어떤 종류의 간결한 방식으로 설명하기 어렵지만(인간의 경우에도) GPT4 발표에서 공유된 이미지 예시 도 흥미로운 기회를 가리킵니다. 단순히 차트 제목과 시각화 종류만 설명하는 차트를 발견했다고 가정해 보겠습니다. 예를 들어, 연간 소득이 30,000달러 미만인 미국 가구의 스마트폰 사용량과 피처폰 사용량을 비교하는 원형 차트입니다. (차트에 대한 대체 텍스트는 데이터에 대한 많은 질문에 답을 주지 않는 경향이 있기 때문에 매우 끔찍한 대체 텍스트가 될 것입니다. 그러나 다시 설명이 해당 위치에 있었다고 가정해 보겠습니다.) 브라우저가 해당 이미지가 원형 차트(온보드 모델이 이를 결론지었기 때문에) 사용자가 그래픽에 대해 다음과 같은 질문을 할 수 있는 세상을 상상해 보세요.
스마트폰이나 피처폰을 사용하는 사람이 더 많나요?
얼마나 더?
이 버킷 중 하나에도 속하지 않는 사람들이 있습니까?
그거 몇 개야?
모델이 그럴듯하게 들리는 "사실"을 구성하는 LLM(대형 언어 모델) 환각 의 현실을 잠시 제쳐두고, 이러한 방식으로 이미지와 데이터에 대해 더 많이 배울 수 있는 기회는 시각 장애인 및 저언어 장애인에게 혁명적일 수 있습니다. 시각 장애인뿐만 아니라 다양한 형태의 색맹, 인지 장애 등을 가진 사람들을 위한 것입니다. 또한 이러한 차트를 볼 수 있는 사람들이 있는 그대로 차트의 데이터를 이해하도록 돕는 것은 교육적인 맥락에서 유용할 수 있습니다 .
한 단계 더 나아가 브라우저에 복잡한 차트를 단순화하도록 요청할 수 있다면 어떨까요? 선 그래프에서 단일 선을 분리하도록 요청할 수 있다면 어떨까요? 색맹 형태에 대해 더 잘 작동하도록 브라우저에 다른 선의 색상을 바꾸도록 요청할 수 있다면 어떨까요? 패턴과 색상을 바꿔달라고 요청할 수 있다면 어떨까요? 이러한 도구의 채팅 기반 인터페이스와 오늘날의 AI 도구에서 이미지를 조작할 수 있는 기존 능력을 고려하면 이는 가능성이 있는 것 같습니다.
이제 해당 차트에서 정보를 추출하고 이를 다른 형식으로 변환할 수 있는 특수 제작 모델을 상상해 보세요. 예를 들어, 원형 차트(또는 일련의 원형 차트)를 스프레드시트와 같이 더 접근하기 쉽고 유용한 형식으로 바꿀 수 있습니다. 정말 놀라울 것 같아요!
매칭 알고리즘
Safiya Umoja Noble은 그녀의 책 제목을 억압의 알고리즘(Algorithms of Oppression) 으로 정했을 때 완전히 정평이 나 있었습니다 . 그녀의 책은 검색 엔진이 인종차별을 강화하는 방식에 초점을 맞추고 있지만 모든 컴퓨터 모델이 갈등, 편견, 편협함을 증폭시킬 수 있는 잠재력을 갖고 있다는 것도 똑같이 사실이라고 생각합니다. 트위터가 항상 지루한 억만장자의 최신 트윗을 보여주든, 유튜브가 우리를 Q홀로 보내든, 인스타그램이 자연 신체의 모습에 대한 우리의 생각을 왜곡하든, 우리는 제대로 작성되지 않고 유지 관리되는 알고리즘이 엄청나게 해롭다는 것을 알고 있습니다. 이러한 현상의 대부분은 이를 형성하고 구축하는 사람들의 다양성이 부족하기 때문에 발생합니다. 그러나 이러한 플랫폼이 포괄적으로 내장되어 구축되면 장애인을 도울 수 있는 알고리즘 개발의 실질적인 잠재력이 있습니다.
예를 들어 Mentra를 예로 들어 보겠습니다 . 그들은 신경다양성 사람들을 위한 고용 네트워크입니다. 그들은 75개 이상의 데이터 포인트를 기반으로 구직자와 잠재적 고용주를 연결하는 알고리즘을 사용합니다. 구직자 측면에서는 각 후보자의 강점, 필요하고 선호하는 직장 숙소, 환경적 민감성 등을 고려합니다. 고용주 측에서는 각 업무 환경, 각 직무와 관련된 의사소통 요소 등을 고려합니다. 신경다양한 사람들이 운영하는 회사인 Mentra는 일반적인 채용 사이트에 대해 대본을 뒤집는 결정을 내렸습니다. 그들은 알고리즘을 사용하여 회사에 사용 가능한 후보자를 제안하고 회사는 관심 있는 구직자와 연결할 수 있습니다. 구직자 측의 감정적, 육체적 노동을 줄여줍니다.
더 많은 장애인이 알고리즘 생성에 참여하면 이러한 알고리즘이 지역 사회에 해를 끼칠 가능성을 줄일 수 있습니다. 그렇기 때문에 다양한 팀이 중요합니다.
소셜 미디어 회사의 추천 엔진이 귀하가 팔로우하는 사람을 분석하고 비슷한 주제에 대해 이야기했지만 기존 영향력 영역과 몇 가지 주요 측면에서 다른 사람들에 대한 추천 팔로우 우선 순위를 지정하도록 조정되었다고 상상해 보세요. 예를 들어, AI에 대해 이야기하는 비장애 백인 남성 학자들을 팔로우한다면, AI에 대해 이야기하는 장애인, 백인이 아니거나 남성이 아닌 학자들을 팔로우하라고 제안할 수 있습니다. 권장 사항을 받아들인다면 아마도 AI 분야에서 무슨 일이 일어나고 있는지에 대해 더 총체적이고 미묘한 이해를 얻게 될 것입니다. 또한 동일한 시스템은 장애인 커뮤니티 등 특정 커뮤니티에 대한 편견에 대한 이해를 활용하여 사용자에게 편견을 지속시키는(또는 더 나쁘게는 혐오감을 표출하는) 계정을 따르도록 권장하지 않도록 해야 합니다. ) 그 그룹.
AI가 장애인을 도울 수 있는 다른 방법
다른 작업 사이에 이것을 결합하려고 하지 않았다면 계속해서 AI를 사용하여 장애인을 도울 수 있는 모든 종류의 예를 제공할 수 있을 것이라고 확신합니다. 이 마지막 섹션을 약간의 번개 라운드로 나눕니다. 특별한 순서는 없습니다:
음성 보존. VALL-E 문서 나 Apple의 글로벌 접근성 인식의 날 발표를 보셨을 수도 있고 Microsoft , Acapela 등 의 음성 보존 서비스에 대해 잘 알고 계실 수도 있습니다 . 당신의 목소리를 복제하도록 AI 모델을 훈련시키는 것이 가능하며, 이는 ALS(루게릭병), 운동 신경 질환 또는 말을 할 수 없게 만드는 기타 질병을 앓고 있는 사람들에게 엄청난 이점이 될 수 있습니다. 물론 이것은 오디오 딥페이크를 만드는 데에도 사용할 수 있는 동일한 기술이므로 책임감 있게 접근해야 하지만 이 기술은 진정으로 혁신적인 잠재력을 가지고 있습니다.
음성 인식. 음성 접근성 프로젝트(Speech Accessibility Project) 와 같은 연구자들은 비정형 언어를 사용하는 사람들의 녹음을 수집하는 데 도움을 준 장애인에게 비용을 지불하고 있습니다. 내가 입력한 대로 그들은 파킨슨병 및 관련 질환을 가진 사람들을 적극적으로 모집하고 있으며 프로젝트가 진행됨에 따라 이를 다른 질환으로 확대할 계획을 가지고 있습니다. 이 연구를 통해 더 많은 장애가 있는 사람들이 음성 도우미, 받아쓰기 소프트웨어, 음성 응답 서비스를 사용할 수 있을 뿐만 아니라 음성만으로 컴퓨터와 기타 장치를 더 쉽게 제어할 수 있게 해주는 보다 포괄적인 데이터 세트가 탄생할 것입니다.
텍스트 변환. 현재 세대의 LLM은 환각을 주입하지 않고도 기존 텍스트 콘텐츠를 조정할 수 있습니다. 이는 텍스트 요약이나 단순화된 버전의 텍스트, 심지어 생체 공학적 읽기 를 위해 준비된 텍스트의 혜택을 받을 수 있는 인지 장애가 있는 사람들에게 큰 힘을 실어줍니다 .
다양한 팀과 데이터의 중요성
우리는 서로의 차이점이 중요하다는 것을 인식해야 합니다. 우리의 생생한 경험은 우리가 존재하는 정체성의 교차점에 의해 영향을 받습니다. 모든 복잡성(그리고 기쁨과 고통)을 지닌 이러한 생생한 경험은 우리가 형성하는 소프트웨어, 서비스 및 사회에 대한 귀중한 입력입니다. 우리의 차이점은 새로운 모델을 훈련하는 데 사용하는 데이터로 표현되어야 하며, 귀중한 정보를 제공하는 사람들은 이를 우리와 공유한 대가로 보상을 받아야 합니다. 포괄적인 데이터 세트는 보다 공평한 결과를 촉진하는 보다 강력한 모델을 생성합니다.
장애인을 비하하거나 후원하거나 대상화하지 않는 모델을 원하십니까? 다양한 장애가 있는 사람들이 작성한 장애 관련 콘텐츠가 있는지 확인하고 해당 콘텐츠가 훈련 데이터에 잘 표현되어 있는지 확인하세요.
장애인 언어를 사용하지 않는 모델을 원하시나요? 기존 데이터 세트를 사용하여 능력주의 언어가 독자에게 도달하기 전에 차단하고 교정할 수 있는 필터를 구축 할 수 있습니다 . 즉, 민감도 판독과 관련하여 AI 모델은 조만간 인간 사본 편집자를 대체하지 않을 것입니다.
즉시 접근 가능한 권장 사항을 제공하는 코딩 부조종사를 원하십니까? 접근 가능하다고 알고 있는 코드로 훈련하세요.
나는 AI가 사람들에게 해를 끼칠 수 있고 앞으로도 해를 끼칠 것이라는 데 의심의 여지가 없습니다. 오늘, 내일, 그리고 미래에도 마찬가지입니다. 그러나 나는 또한 우리가 접근성(더 넓게는 포용성)을 염두에 두고 AI에 대한 접근 방식을 사려 깊고 사려 깊고 의도적으로 변경하여 시간이 지남에 따라 피해를 줄일 수 있다는 점을 인정할 수 있다고 믿습니다. 오늘, 내일, 그리고 미래에도 마찬가지입니다.
이 작품의 개발에 도움을 준 Kartik Sawhney, 편집에 귀중한 도움을 준 Ashley Bischoff, 그리고 프롬프트를 제공한 Joe Dolson에게 많은 감사를 드립니다.