WORK ABOUT LAB CONTACT
contact@yellow-finger.com
02.2205.4128
The Physics Principle That Inspired Modern AI Art
현대 인공지능 예술에 영감을 준 물리학 원리입니다
The Physics Principle That Inspired Modern AI Art
Diffusion models generate incredible images by learning to reverse the process that, among other things, causes ink to spread through water.
확산 모델은 무엇보다도 잉크가 물을 통해 퍼지도록 하는 과정을 역전시키는 방법을 학습함으로써 놀라운 이미지를 생성합니다.
요약 :)
DALL·E 2에게 물어보세요.OpenAI에서 만든 이미지 생성 시스템은 "해변에서 코카콜라를 후루룩 마시는 금붕어" 그림을 그리고 정확히 그 초현실적인 이미지를 내뱉습니다. 프로그램은 훈련 중에 해변, 금붕어, 코카콜라의 이미지를 접했을 것이지만 세 가지가 모두 함께 있는 이미지를 보았을 가능성은 거의 없습니다. 그러나 DALL·E 2는 개념을 Dalí를 자랑스럽게 만들 수 있는 것으로 조합할 수 있습니다.
더보기→

출처.
ANIL ANANTHASWAMY. (2023.02.19). WIRED. The Physics Principle That Inspired Modern AI Art. 2023.02.20. https://www.wired.com/story/the-physics-principle-that-inspired-modern-ai-art/
DALL·E 2에게 물어보세요.OpenAI에서 만든 이미지 생성 시스템은 "해변에서 코카콜라를 후루룩 마시는 금붕어" 그림을 그리고 정확히 그 초현실적인 이미지를 내뱉습니다. 프로그램은 훈련 중에 해변, 금붕어, 코카콜라의 이미지를 접했을 것이지만 세 가지가 모두 함께 있는 이미지를 보았을 가능성은 거의 없습니다. 그러나 DALL·E 2는 개념을 Dalí를 자랑스럽게 만들 수 있는 것으로 조합할 수 있습니다. 원래 이야기는 수학과 물리 및 생명 과학의 연구 개발 및 추세를 다루어 과학에 대한 대중의 이해를 높이는 것을 사명으로 하는 Simons Foundation 의 사설 독립 간행물인 Quanta Magazine 의 허가를 받아 재인쇄되었습니다 . DALL·E 2는 품질 및 다양성 측면에서 데이터에 필적하는 새로운 것을 생성하기 위해 교육 데이터를 사용하려고 시도하는 시스템인 생성 모델의 한 유형입니다. 이것은 기계 학습에서 가장 어려운 문제 중 하나이며 이 지점에 도달하는 것은 어려운 여정이었습니다. 이미지에 대한 최초의 중요한 생성 모델은 신경망(인공 뉴런이라고 하는 계산 단위의 여러 계층으로 구성된 프로그램)이라는 인공 지능에 대한 접근 방식을 사용했습니다. 그러나 이미지의 품질이 좋아지더라도 모델을 신뢰할 수 없고 훈련하기 어려운 것으로 판명되었습니다. 한편, 물리학에 대한 열정을 가진 박사 후 연구원이 만든 강력한 생성 모델은 두 명의 대학원생이 기술적 혁신을 일으켜 야수에게 생명을 불어넣을 때까지 휴면 상태에 있었습니다. DALL·E 2는 그런 야수입니다. 경쟁사 Stable Diffusion 및 Imagen의 이미지와 마찬가지로 DALL·E 2의 이미지를 가능하게 하는 핵심 통찰력은 물리학 세계에서 나옵니다. 확산 모델로 알려진 이를 뒷받침하는 시스템은 유체 및 기체의 확산과 같은 현상을 지배하는 비평형 열역학에서 크게 영감을 받았습니다. OpenAI의 기계 학습 연구원인 Yang Song은 "처음에 물리학자들이 발명한 기술이 많이 있으며 현재는 기계 학습에서 매우 중요합니다."라고 말했습니다 . 이러한 모델의 힘은 업계와 사용자 모두를 뒤흔들었습니다. California Institute of Technology의 컴퓨터 과학자이자 Nvidia의 기계 학습 연구 수석 이사인 Anima Anandkumar는 "지금은 생성 모델을 위한 흥미로운 시기입니다."라고 말했습니다 . 그리고 확산 모델에 의해 생성된 사실적으로 보이는 이미지는 때때로 사회적 및 문화적 편견을 영속시킬 수 있지만 "우리는 생성 모델이 예측 AI 모델의 공정성을 개선하는 다운스트림 작업에 유용하다는 것을 입증했습니다."라고 말했습니다. 광고 높은 확률 데이터 생성이 이미지에 대해 어떻게 작동하는지 이해하기 위해 두 개의 인접한 그레이스케일 픽셀로 구성된 간단한 이미지부터 시작하겠습니다. 각 픽셀의 음영에 따라 두 가지 값으로 이 이미지를 완전히 설명할 수 있습니다(완전히 검은색인 0에서 완전히 흰색인 255까지). 이 두 값을 사용하여 이미지를 2D 공간의 점으로 그릴 수 있습니다. 여러 이미지를 점으로 플로팅하면 특정 이미지와 해당 픽셀 값이 다른 이미지보다 더 자주 발생하는 클러스터가 나타날 수 있습니다. 이제 표면의 높이가 클러스터의 밀도에 해당하는 평면 위의 표면을 상상해 보십시오. 이 표면은 확률 분포를 매핑합니다. 표면의 가장 높은 부분 아래에서 개별 데이터 포인트를 찾을 가능성이 가장 높으며 표면이 가장 낮은 곳에서는 거의 찾을 수 없습니다. 광고 DALL·E 2는 "해변에서 코카콜라를 후루룩 마시는 금붕어" 이미지를 생성했습니다. OpenAI가 만든 프로그램은 아마도... DALL·E 2는 "해변에서 코카콜라를 후루룩 마시는 금붕어" 이미지를 생성했습니다. OpenAI에서 만든 이 프로그램은 유사한 이미지를 본 적이 없을 가능성이 높지만 여전히 자체적으로 이미지를 생성할 수 있습니다. DALL·E 2 제공 인기있는 영상 ChatGPT로 영어 선생님이 숙제를 채점하다 가장 인기 많은 iPhone의 충전 포트에 YubiKey를 삽입하는 사람의 손 클로즈업 보안 보안 키로 iPhone을 잠금 해제하는 방법 데이비드 닐드 땋은 머리를 땋은 Goody Addams 역의 Jenna Ortega가 전경의 어두운 인물을 마주하고 있습니다. 문화 지금 넷플릭스에서 볼 수 있는 46개의 베스트 쇼 열광한 마우스 커서가 오른쪽에 있는 상태에서 컴퓨터 휴지통에 들어가는 Internet Explorer 로고 기어 Microsoft는 PC에서 Internet Explorer를 강제로 제거하고 있습니다. 분 애쉬워스 A, B, C, D, E 어두운 배경의 흰색 키보드 키 캡에 있는 알파벳 문자 보안 해커들은 거의 3년 동안 GoDaddy 내부를 날뛰었습니다. 앤디 그린버그 광고 이제 이 확률 분포를 사용하여 새 이미지를 생성할 수 있습니다. 당신이 해야 할 일은 확률이 더 높은 데이터를 더 자주 생성한다는 제한(분포 "샘플링"이라고 하는 프로세스)을 준수하면서 새 데이터 포인트를 무작위로 생성하는 것입니다. 각각의 새로운 점은 새로운 이미지입니다. 예를 들어 각각 백만 개의 픽셀이 있는 보다 사실적인 그레이스케일 사진에 대해서도 동일한 분석이 적용됩니다. 지금은 각 이미지를 플로팅하는 데 두 개의 축이 아니라 백만 개의 축이 필요합니다. 그러한 이미지에 대한 확률 분포는 복잡한 백만 + 1차원 표면이 될 것입니다. 해당 분포를 샘플링하면 백만 픽셀 값이 생성됩니다. 해당 픽셀을 종이에 인쇄하면 이미지가 원본 데이터 세트의 사진처럼 보일 수 있습니다. 생성 모델링의 과제는 훈련 데이터를 구성하는 일부 이미지 집합에 대해 이 복잡한 확률 분포를 학습하는 것입니다. 이 분포는 부분적으로는 데이터에 대한 광범위한 정보를 캡처하기 때문에 유용하고 부분적으로는 연구원이 다양한 유형의 데이터(예: 텍스트 및 이미지)에 대한 확률 분포를 결합하여 해변에서 금붕어가 코카콜라를 후루룩 마시는 것과 같은 초현실적인 출력을 구성할 수 있기 때문에 유용합니다. . Anandkumar는 "다른 개념을 혼합하고 일치시켜 교육 데이터에서 볼 수 없었던 완전히 새로운 시나리오를 만들 수 있습니다."라고 말했습니다. 2014년에는 GAN(Generative Adversarial Network)이라는 모델이 최초로 사실적인 이미지를 생성했습니다. Anandkumar는 "너무 흥분되었습니다."라고 말했습니다. 그러나 GAN은 훈련하기 어렵습니다. 전체 확률 분포를 학습하지 못할 수 있으며 분포의 하위 집합에서만 이미지를 생성하도록 고정될 수 있습니다. 예를 들어 다양한 동물의 이미지에 대해 훈련된 GAN은 개 사진만 생성할 수 있습니다. 기계 학습에는 보다 강력한 모델이 필요했습니다. 물리학에서 영감을 얻은 Jascha Sohl-Dickstein이 하나를 제공할 것입니다. 흥분의 얼룩 GAN이 발명될 무렵, Sohl-Dickstein은 비평형 열역학에 부차적인 관심을 가지고 생성 모델을 연구하는 스탠포드 대학의 박사후 연구원이었습니다. 물리학의 이 분야는 열평형 상태가 아닌 시스템, 즉 내부적으로 그리고 환경과 물질과 에너지를 교환하는 시스템을 연구합니다. 예시적인 예는 물통을 통해 퍼지는 파란색 잉크 한 방울입니다. 처음에는 한 지점에 검은 얼룩을 형성합니다. 이 시점에서 용기의 작은 부피에서 잉크 분자를 찾을 확률을 계산하려면 잉크가 퍼지기 전에 초기 상태를 깔끔하게 모델링하는 확률 분포가 필요합니다. 그러나이 분포는 복잡하고 따라서 샘플링하기 어렵습니다. 그러나 결국 잉크는 물 전체에 확산되어 옅은 파란색이 됩니다. 이는 간단한 수학적 표현으로 설명할 수 있는 분자의 훨씬 더 단순하고 균일한 확률 분포로 이어집니다. 비평형 열역학은 확산 과정의 각 단계에서 확률 분포를 설명합니다. 결정적으로, 각 단계는 되돌릴 수 있습니다. 충분히 작은 단계로 간단한 배포에서 복잡한 배포로 돌아갈 수 있습니다. Jascha SohlDickstein은 확산 원리를 기반으로 생성 모델링을 위한 새로운 접근 방식을 만들었습니다. Jascha Sohl-Dickstein은 확산 원리를 기반으로 생성 모델링을 위한 새로운 접근 방식을 만들었습니다. 미야카와 아사코 제공 가장 인기 많은 iPhone의 충전 포트에 YubiKey를 삽입하는 사람의 손 클로즈업 보안 보안 키로 iPhone을 잠금 해제하는 방법 데이비드 닐드 땋은 머리를 땋은 Goody Addams 역의 Jenna Ortega가 전경의 어두운 인물을 마주하고 있습니다. 문화 지금 넷플릭스에서 볼 수 있는 46개의 베스트 쇼 열광한 마우스 커서가 오른쪽에 있는 상태에서 컴퓨터 휴지통에 들어가는 Internet Explorer 로고 기어 Microsoft는 PC에서 Internet Explorer를 강제로 제거하고 있습니다. 분 애쉬워스 A, B, C, D, E 어두운 배경의 흰색 키보드 키 캡에 있는 알파벳 문자 보안 해커들은 거의 3년 동안 GoDaddy 내부를 날뛰었습니다. 앤디 그린버그 광고 Sohl-Dickstein은 확산 원리를 사용하여 생성 모델링을 위한 알고리즘을 개발했습니다. 아이디어는 간단합니다. 알고리즘은 먼저 교육 데이터 세트의 복잡한 이미지를 단순한 노이즈로 전환한 다음(잉크 덩어리에서 옅은 파란색 물을 확산시키는 것과 유사) 시스템에 이 과정을 역전시켜 노이즈를 이미지로 전환하는 방법을 알려줍니다. 작동 방식은 다음과 같습니다. 먼저 알고리즘이 훈련 세트에서 이미지를 가져옵니다. 이전과 마찬가지로 백만 개의 픽셀 각각에 어떤 값이 있고 백만 차원 공간에서 이미지를 점으로 그릴 수 있다고 가정해 보겠습니다. 이 알고리즘은 모든 시간 단계에서 각 픽셀에 약간의 노이즈를 추가하며 이는 하나의 작은 시간 단계 후에 잉크가 확산되는 것과 같습니다. 이 프로세스가 계속됨에 따라 픽셀 값은 원본 이미지의 값과 관계가 줄어들고 픽셀은 단순한 노이즈 분포처럼 보입니다. (알고리즘은 또한 각 픽셀 값을 각 시간 단계에서 모든 축의 0 값인 원점을 향해 조금씩 이동합니다. 이 이동은 픽셀 값이 컴퓨터가 쉽게 작업하기에 너무 커지는 것을 방지합니다.) 데이터 세트의 모든 이미지에 대해 이 작업을 수행하면 100만 차원 공간에 있는 점의 초기 복잡한 분포(쉽게 설명하고 샘플링할 수 없음)가 원점 주변의 단순하고 정상적인 점 분포로 바뀝니다. Sohl-Dickstein은 "변환 시퀀스는 매우 느리게 데이터 분포를 큰 노이즈 볼로 바꿉니다."라고 말했습니다. 이 "정방향 프로세스"는 쉽게 샘플링할 수 있는 분포를 제공합니다. Yang Song은 노이즈를 효과적으로 해독하기 위해 네트워크를 훈련하여 이미지를 생성하는 새로운 기술을 고안하는 데 도움을 주었습니다. Yang Song은 잡음이 많은 이미지를 효과적으로 해독하기 위해 네트워크를 훈련하여 이미지를 생성하는 새로운 기술을 고안하는 데 도움을 주었습니다. 양 송의 의례 다음은 기계 학습 부분입니다. 순방향 패스에서 얻은 잡음이 많은 이미지를 신경망에 제공하고 한 단계 앞서 나온 잡음이 적은 이미지를 예측하도록 훈련시킵니다. 처음에는 실수를 하므로 더 잘 작동하도록 네트워크 매개변수를 조정합니다. 결국 신경망은 단순 분포의 샘플을 나타내는 노이즈 이미지를 복잡한 분포의 샘플을 나타내는 이미지로 안정적으로 전환할 수 있습니다. 훈련된 네트워크는 완전한 생성 모델입니다. 이제 정방향 패스를 수행할 원본 이미지도 필요하지 않습니다. 간단한 분포에 대한 완전한 수학적 설명이 있으므로 여기에서 직접 샘플링할 수 있습니다. 신경망은 이 샘플(본질적으로 정적)을 교육 데이터 세트의 이미지와 유사한 최종 이미지로 변환할 수 있습니다. Sohl-Dickstein은 확산 모델의 첫 번째 출력을 회상합니다. "당신은 눈을 가늘게 뜨고 '저 색깔 얼룩이 트럭처럼 보이는 것 같아'라고 생각할 것입니다."라고 그는 말했습니다. “여러 달 동안 픽셀의 다양한 패턴을 응시하고 구조를 보려고 애쓰며 '이건 이전보다 훨씬 더 구조적이야.'라고 생각했습니다. 나는 매우 흥분했다." 미래를 상상하다 Sohl-Dickstein은 2015년에 자신의 확산 모델 알고리즘을 발표했지만 여전히 GAN이 할 수 있는 것보다 훨씬 뒤떨어져 있었습니다. 확산 모델은 전체 배포에 대해 샘플링할 수 있고 이미지의 하위 집합만 뱉어내는 일이 절대 없지만 이미지가 더 나빠 보이고 프로세스가 너무 느립니다. Sohl-Dickstein은 "당시에는 이것이 흥미롭다고 생각하지 않았습니다."라고 말했습니다. Sohl-Dickstein이나 서로를 알지 못하는 두 명의 학생이 이 초기 작업의 점을 DALL·E 2와 같은 현대 확산 모델에 연결해야 했습니다. 첫 번째는 당시 스탠포드의 박사 과정 학생인 Song이었습니다. . 2019년에 그와 그의 고문은 데이터(고차원 표면)의 확률 분포를 추정하지 않는 생성 모델을 구축하는 새로운 방법을 발표했습니다 . 대신 분포의 기울기를 추정했습니다(고차원 표면의 기울기로 생각하십시오). 가장 인기 많은 iPhone의 충전 포트에 YubiKey를 삽입하는 사람의 손 클로즈업 보안 보안 키로 iPhone을 잠금 해제하는 방법 데이비드 닐드 땋은 머리를 땋은 Goody Addams 역의 Jenna Ortega가 전경의 어두운 인물을 마주하고 있습니다. 문화 지금 넷플릭스에서 볼 수 있는 46개의 베스트 쇼 열광한 마우스 커서가 오른쪽에 있는 상태에서 컴퓨터 휴지통에 들어가는 Internet Explorer 로고 기어 Microsoft는 PC에서 Internet Explorer를 강제로 제거하고 있습니다. 분 애쉬워스 A, B, C, D, E 어두운 배경의 흰색 키보드 키 캡에 있는 알파벳 문자 보안 해커들은 거의 3년 동안 GoDaddy 내부를 날뛰었습니다. 앤디 그린버그 광고 Song은 처음에 훈련 데이터 세트의 각 이미지를 노이즈 수준이 증가하면서 교란한 다음 신경망에 배포의 기울기를 사용하여 원본 이미지를 예측하도록 요청하여 효과적으로 노이즈를 제거하는 경우 자신의 기술이 가장 잘 작동한다는 것을 발견했습니다. 일단 훈련을 받으면 그의 신경망은 단순 분포에서 샘플링된 노이즈 이미지를 가져와 이를 훈련 데이터 세트를 대표하는 이미지로 점진적으로 다시 전환할 수 있습니다. 이미지 품질은 훌륭했지만 그의 기계 학습 모델은 샘플링 속도가 너무 느렸습니다. 그리고 그는 Sohl-Dickstein의 작업에 대한 지식 없이 이것을 했습니다. 송씨는 “확산 모델에 대해 전혀 몰랐다. “2019년 논문이 출판된 후 Jascha로부터 이메일을 받았습니다. 그는 [우리 모델]이 매우 강한 연결 고리를 가지고 있다고 지적했습니다.” 2020년에 두 번째 학생은 이러한 연결을 보고 Song의 작업이 Sohl-Dickstein의 확산 모델을 개선할 수 있음을 깨달았습니다. Jonathan Ho는 최근 UC Berkeley에서 생성 모델링에 대한 박사 과정을 마쳤지만 계속 작업했습니다. "나는 그것이 기계 학습의 가장 수학적으로 아름다운 하위 분야라고 생각했습니다."라고 그는 말했습니다. Ho는 Sohl-Dickstein의 확산 모델을 Song의 아이디어와 신경망 세계의 다른 발전으로 재설계하고 업데이트했습니다. "커뮤니티의 관심을 끌기 위해서는 모델이 멋진 샘플을 생성하도록 해야 한다는 것을 알고 있었습니다."라고 그는 말했습니다. “당시에는 이것이 내가 할 수 있는 가장 중요한 일이라고 확신했습니다.” 그의 직감은 정확했다. Ho와 그의 동료들은 2020년 " Denoising Diffusion Probabilistic Models " 라는 제목의 논문에서 이 새롭고 개선된 확산 모델을 발표했습니다 . 연구원들이 이제 이를 단순히 DDPM이라고 부르는 것은 매우 획기적인 일이 되었습니다. 생성된 이미지의 분포를 훈련 이미지의 분포와 비교하는 이미지 품질의 한 벤치마크에 따르면 이러한 모델은 GAN을 포함한 모든 경쟁 생성 모델과 일치하거나 능가했습니다. 큰 선수들이 주목하기까지는 그리 오래 걸리지 않았습니다. 이제 DALL·E 2, Stable Diffusion, Imagen 및 기타 상용 모델은 모두 약간의 DDPM 변형을 사용합니다. Jonathan Ho와 그의 동료들은 SohlDickstein과 Songs 방법을 결합하여 다음과 같은 현대 확산 모델을 만들었습니다. Jonathan Ho와 그의 동료들은 Sohl-Dickstein과 Song의 방법을 결합하여 DALL·E 2와 같은 현대적인 확산 모델을 만들었습니다. 조나단 호의 의례 가장 인기 많은 iPhone의 충전 포트에 YubiKey를 삽입하는 사람의 손 클로즈업 보안 보안 키로 iPhone을 잠금 해제하는 방법 데이비드 닐드 땋은 머리를 땋은 Goody Addams 역의 Jenna Ortega가 전경의 어두운 인물을 마주하고 있습니다. 문화 지금 넷플릭스에서 볼 수 있는 46개의 베스트 쇼 열광한 마우스 커서가 오른쪽에 있는 상태에서 컴퓨터 휴지통에 들어가는 Internet Explorer 로고 기어 Microsoft는 PC에서 Internet Explorer를 강제로 제거하고 있습니다. 분 애쉬워스 A, B, C, D, E 어두운 배경의 흰색 키보드 키 캡에 있는 알파벳 문자 보안 해커들은 거의 3년 동안 GoDaddy 내부를 날뛰었습니다. 앤디 그린버그 광고 최신 확산 모델에는 GPT-3과 같은 LLM(Large Language Model)이라는 핵심 요소가 하나 더 있습니다. 이들은 이미지 대신 단어에 대한 확률 분포를 학습하기 위해 인터넷의 텍스트로 훈련된 생성 모델입니다. 2021년 현재 스텔스 회사의 연구 과학자인 Ho와 Google Research의 그의 동료 Tim Salimans는 다른 팀과 함께 LLM의 정보와 이미지 생성 확산 모델을 결합하여 텍스트를 사용하는 방법을 보여주었습니다. "해변에서 코카콜라를 후루룩 마시는 금붕어") 확산 과정과 그에 따른 이미지 생성을 안내합니다. DALL·E 2와 같은 텍스트-이미지 모델의 성공 뒤에는 이러한 "가이드 확산" 프로세스가 있습니다. "그들은 내 예상을 훨씬 뛰어 넘습니다."라고 Ho가 말했습니다. "나는 이 모든 것이 다가오는 것을 본 척하지 않을 것입니다." 문제 생성 이러한 모델이 성공한 만큼 DALL·E 2와 그 유사품의 이미지는 여전히 완벽하지 않습니다. 대규모 언어 모델은 생성하는 텍스트에 인종차별 및 성차별과 같은 문화적, 사회적 편견을 반영할 수 있습니다. 그것은 그들이 인터넷에서 가져온 텍스트에 대해 훈련을 받았고 종종 그러한 텍스트에는 인종차별적이고 성차별적인 언어가 포함되어 있기 때문입니다. 그러한 텍스트에 대한 확률 분포를 학습하는 LLM은 동일한 편향을 갖게 됩니다. 확산 모델은 유사하게 편향된 데이터를 포함할 수 있는 인터넷에서 가져온 선별되지 않은 이미지에 대해서도 훈련됩니다. LLM을 오늘날의 확산 모델과 결합하면 때때로 사회의 병폐를 반영하는 이미지가 생성될 수 있다는 것은 놀라운 일이 아닙니다. Anandkumar는 직접 경험했습니다. 확산 모델 기반 앱을 사용하여 자신의 양식화된 아바타를 생성하려고 했을 때 그녀는 충격을 받았습니다. 그녀는 "많은 이미지가 매우 성적으로 묘사된 반면 남성에게 제시된 것은 그렇지 않았습니다."라고 말했습니다. 그녀는 혼자가 아닙니다 . 이러한 편향은 데이터를 큐레이팅 및 필터링하거나(데이터 세트의 방대함을 고려할 때 매우 어려운 작업) 이러한 모델의 입력 프롬프트와 출력을 모두 확인함으로써 줄일 수 있습니다. "물론 신중하고 광범위한 안전 테스트를 대신할 수 있는 것은 없습니다."라고 Ho는 말했습니다. "이것은 현장에서 중요한 도전입니다." Fast Forward 뉴스레터를 통해 기술의 다음 단계를 확인하십시오. 인공 지능과 자율 주행 자동차에서 변화된 도시와 새로운 스타트업에 이르기까지 최신 뉴스에 가입하세요. 귀하의 이메일 이메일을 입력하세요 제출하다 가입함으로써 귀하는 당사의 사용자 계약 ( 집단 소송 포기 및 중재 조항 포함 ), 당사의 개인 정보 보호정책 및 쿠키 정책 에 동의 하고 WIRED로부터 마케팅 및 계정 관련 이메일을 수신하는 데 동의합니다. 언제든지 구독을 취소할 수 있습니다. 이러한 우려에도 불구하고 Anandkumar는 생성 모델링의 힘을 믿습니다. “저는 Richard Feynman의 인용문을 정말 좋아합니다. '내가 만들 수 없는 것은 이해할 수 없습니다.' 그녀의 팀은 예를 들어 얼굴 인식을 위한 더 어두운 피부 톤과 같은 예측 작업을 위해 잘 알려지지 않은 클래스의 합성 훈련 데이터를 생산하는 생성 모델을 개발하여 공정성을 개선하는 데 도움이 되는 생성 모델을 개발할 수 있었습니다. 생성 모델은 또한 우리의 뇌가 시끄러운 입력을 처리하는 방법이나 정신적 이미지를 떠올리고 미래의 행동을 고려하는 방법에 대한 통찰력을 제공할 수 있습니다. 그리고 보다 정교한 모델을 구축하면 AI에 유사한 기능을 부여할 수 있습니다. Anandkumar는 “제너레이티브 AI로 할 수 있는 가능성의 시작에 불과하다고 생각합니다. 원래 이야기는 수학과 물리 및 생명 과학의 연구 개발 및 추세를 다루어 과학에 대한 대중의 이해를 높이는 것을 사명으로 하는 Simons Foundation 의 사설 독립 간행물인 Quanta Magazine 의 허가를 받아 재인쇄되었습니다 .