2023년 6월 3주차 데이터 시각화 큐레이션
지난 2022년 11월, AI 챗봇인 ChatGPT가 세상에 출시된 지 5일만에 100만 사용자를 달성하며 큰 화제가 되었습니다. 이제는 누구나 AI의 존재를 알고 있죠! 하지만 AI가 대중화되면서 AI의 위험성에 대한 우려 또한 대두되고 있는데요. 오늘은 그 중 하나의 사례를 시각화 차트와 함께 소개해 보려고 합니다.

AI 모델 중 하나인 Stable Diffusion은 텍스트를 이미지로 만들어 주는 인공지능입니다. 예를 들어, ‘강아지의 사진’이라는 텍스트를 입력하면 자동으로 강아지 사진을 생성해 주죠! 그림의 분위기를 지정할 수 있을 뿐만 아니라 심지어는 피카소와 같은 예술가의 화풍을 담을 수도 있습니다. 말만 들으면 참 좋은 기능인데, 왜 문제가 될까요?
미국의 한 언론사 Bloomberg에서는 Stable Diffusion을 사용해 일반적으로 고임금으로 분류되는 직업 7개와 저임금으로 분류되는 직업 7개에 대해 이미지를 생성했습니다. 직업당 300개의 이미지를 생성한 뒤 생성된 이미지를 1부터 6단계의 피부색으로 분류했습니다. 1에서 3은 밝은 피부, 4에서 6은 어두운 피부로 정의되었어요.
그 결과, 사진과 같은 와플 차트가 그려졌습니다. 와플 차트는 격자 무늬의 사각형을 전체 데이터로 보고, 범주형 변수의 항목별 데이터 크기에 따라 격자 무늬의 낱개 셀을 다르게 색칠하는 시각화인데요! 색칠한 셀의 수 또는 영역의 면적에 따라 특정 항목이 전체 중 차지하는 비율을 알 수 있습니다. 사진을 보면 변호사, CEO 등 고임금 직업에 해당하는 첫 번째 줄의 와플 차트에서는 1~3단계의 밝은 피부가 큰 영역을 차지한 것을 알 수 있어요. 반면 패스트푸드점 근로자, 사회복지사 등 저임금 직업에 해당하는 두 번째 줄의 와플 차트에서는 4~6단계의 어두운 피부가 큰 영역을 차지했는데요. 이를 통해 Stable Diffusion 모델이 편향된 시각으로 이미지를 생성하고 있다는 점을 파악할 수 있습니다.
AI 모델이 고도화되면 AI가 새성하는 이미지는 점점 실제 사진과 구분하기 어려워질 텐데요. 이 사례와 같이 AI를 통해서 고정관념이 담긴 이미지가 반복적으로 만들어지고, 무분별하게 배포된다면 실제 사회에도 좋지 못한 영향을 끼치게 될 것 같다는 걱정이 들기도 합니다. 여러분은 어떻게 생각하시나요? 링크를 클릭해 더 자세한 이야기를 알아보세요!
