삼항플롯의 원리, 해석 방법, 인사이트 도출 방법까지 한눈에!

가끔 시각화 사례를 찾아보다 보면, 생소한 차트 유형을 접하면서 시각화의 무궁무진한 가능성과 다양성에 새삼 놀라게 됩니다. 동시에 ‘왜 이렇게 독특한 차트를 선택했을까’라는 의문이 들며, 저자의 의도가 궁금해지기도 하죠. 데이터 시각화는 유형마다 고유한 장단점이 존재하기 마련입니다. 단순히 심미적인 이유로 선택된 복잡한 차트 유형은 오히려 해석을 어렵게 만들고, 저자가 전달하고자 하는 메시지의 설득력을 떨어뜨릴 수 있습니다.
자주 접하지는 않지만, 생소한 차트 유형을 볼 때에는 반가움과 동시에 “이 차트의 장점을 잘 살렸을까?”, “이 유형을 활용한 데이터 시각화로 설득력을 더했을까?”라는 궁금증이 들기도 합니다. 에디터인 저에게 이 사례에 해당하는 차트가 있다면, 바로 삼각형 모양의 차트 ‘삼항 플롯(Ternary plot)’을 들 수 있습니다.

삼항 플롯은 정삼각형 내에 데이터 위치를 표현해 3가지 변수 간의 관계를 나타낸 시각화 방식입니다. 3가지 변수를 한꺼번에 비교할 수 있다는 장점이 있지만 그만큼 해석이 복잡해보인다는 단점이 있습니다. 이 시각화는 주로 물리화학, 석유학, 지질학과 같은 물상과학 분야에 많이 활용되는데요! 예시로 토성에서 발견된 모래, 실트, 진흙의 비율을 삼항 플롯으로 표현하기도 합니다.
다소 낯설지만 알고보면 그렇게 어렵지 않은 삼항 플롯, 어떻게 하면 잘 이해할 수 있을까요? 이번 글에서는 삼항 플롯의 기본 원리부터 시작해, 해석 방법과 인사이트를 빠르고 쉽게 도출할 수 있는 방법 3가지를 하나씩 소개하고자 합니다. 차근히 읽어볼까요?
1. 삼항 플롯, 도대체 어떻게 읽나요..?
삼항 플롯이 다른 시각화에 비해 덜 주목받는 이유 중 하나는 해석의 어려움이 가장 크기 때문이 아닐까 싶은데요! 해당 차트를 이해하려면 가장 기본적인 원리부터 익혀야 합니다. 이 과정이 가장 어렵게 느껴질 수도 있지만, 한 번 이해하고 나면 삼항 플롯을 훨씬 더 즐겁게 바라볼 수 있을 것입니다. 그럼 잠깐 심호흡을 하고, 본격적으로 시작해 볼까요?

삼항 플롯의 기본 구조는 정삼각형이며, 일반적으로 각 꼭짓점에는 변수(필드) 이름을 표시합니다. 이 꼭짓점은 해당 변수의 비율값 100%를 의미하는데요. 3가지 변수로 구성된 데이터는 각 변수의 비율값에 따라 삼항 플롯 안에서 다르게 분포되는데요. 데이터가 어느 꼭짓점을 중심으로 몰려 있는지를 기준으로 변수 간의 관계를 파악할 수 있습니다.
위 그림을 살펴볼까요? 해당 삼항 플롯의 꼭짓점에는 ‘변수1’, ‘변수2’, ‘변수3’이 각각 위치해 있습니다. 데이터는 이 3가지 변수의 비율에 따라 삼각형 내에 빨간색 점으로 분포되어 있는데요. 정확한 비율값을 알기도 전에, 상단 꼭짓점 주변에 데이터가 몰려 있는 걸로 봐선 ‘변수 1’의 비율이 상대적으로 높은 것을 추측할 수 있습니다.

삼항 플롯의 변수명을 표시하는 방법은 크게 2가지로 나눌 수 있습니다. 이해를 돕기 위해 변수명을 A, B, C라 정의하고 그림을 기준으로 설명하겠습니다.
첫 번째 방법은 각 꼭짓점에 변수명을 표시하는 방식입니다. 왼쪽 그림에서 변수 A는 상단 꼭짓점에, 변수 B가 왼쪽 하단 꼭짓점에, 변수 C가 오른쪽 하단 꼭짓점에 표시되어 있는데요. 꼭짓점은 해당 변수의 비율값이 100%인 지점을 의미하므로, 매우 직관적인 방식이라 할 수 있습니다.

두 번째 방법은 꼭짓점이 아닌 삼각형의 변(Side)에 변수명을 표시하는 것입니다. 여기서 혼란스러울 수 있는 부분은, 꼭짓점에 있던 변수명을 어느 변에 표시해야 하느냐입니다. 예를 들어, 변수 A를 삼각형의 변에 표시하려면 왼쪽 변인지 오른쪽 변인지 결정해야 하는데요! 각 변의 비율값 진행 방향, 즉 0%에서 100%로 증가하는 방향을 기준으로 표시하는 것이 좋습니다.
오른쪽 그림을 보면, 첫 번째 방법과 동일한 꼭짓점 위치를 유지하면서 변수명만 삼각형의 변으로 옮긴 모습을 확인할 수 있습니다. 변수 A를 왼쪽 변이 아닌 오른쪽 변에 표시한 이유는, 해당 변의 비율값이 아래에서 위로 증가하기 때문인데요! 상단 꼭짓점에 가까워질수록 변수 A의 비율이 100%에 가까워지기 때문에, 오른쪽 변이 변수 A의 비율을 나타낸다는 것을 알 수 있습니다. 따라서 변수명 A를 오른쪽 변에 표시하고, 비율값의 방향을 나타내는 화살표(빨간색)도 아래에서 위를 향하도록 설정했습니다.
이 과정과 변수 A의 화살표를 통해 우리는 삼항 플롯 내 비율값을 시계 반대 방향으로 읽어야 한다는 정보를 얻을 수 있습니다. 변수 B(파란색)는 왼쪽 변에서 위에서 아래로, 변수 C(초록색)는 하단 변에서 왼쪽에서 오른쪽으로 읽어야 하는 방식이죠.

여기서 짚고 넘어가야 할 점은 모든 삼항 플롯에서 변수별 비율값은 반드시 시계 반대 방향으로 읽는 방식이 아니라는 점입니다. 위 그림은 꼭짓점을 향해 비율값이 상승하는 방향을 이해하는 데 도움을 주기 위한 시각적 자료 요소입니다. 어느 방향이든 꼭짓점에 가까울수록 해당 변수의 비율은 100%에 가까워진다는 뜻이죠. 삼항 플롯 내에서는 꼭짓점마다 10단계로 나뉘어진 라인을 확인할 수 있는데요. 가장 거리가 먼 라인은 0%이며, 꼭짓점을 향해 갈수록 10%씩 상승합니다. 비율값의 방향은 차트마다 다를 수 있으며, 이를 파악하기 위해서는 꼭짓점을 향할수록 비율이 증가하는 방향을 가진 변을 확인해야 합니다.
2. 삼항 플롯, 직접 읽어보며 감을 잡자!

연습 삼아 위 삼항 플롯의 데이터를 변수별로 읽어볼까요?

먼저 차트 영역 중앙의 점을 기준으로 변수 A(빨간색)의 비율을 해석하려면 꼭짓점을 향해 상승한 라인 갯수를 세어야 하는데요. 하단 변에서 총 5단계를 올라감으로써 변수 A 비율값이 50%라는 것을 알 수 있습니다. 변수 B는 오른쪽 변을 기준으로 왼쪽 하단 꼭짓점을 향해 두 단계 상승했기 때문에 20%를 차지합니다. 변수 C는 어떨까요? 왼쪽 변을 기준으로 3단계 올라갔으니 비율값은 30%입니다. 따라서 해당 데이터는 변수 A 50%, 변수 B 20%, 변수 C 30%로 구성되어 있음을 알 수 있습니다.

활용 사례를 통해 이해를 더해볼까요? 위 삼항 플롯은 개인의 주요 이동 수단을 비율로 나타낸 사례인데요. 삼각형 변에는 도보(노란색), 대중교통(파란색), 자가용(빨간색)이 각각 위치해 있습니다. 삼항 플롯 안에 표시된 아이콘은 ‘자신(You)’을 뜻하는데요. 개인이 3가지 이동 수단을 어느 정도씩 이용하는지 확인할 수 있습니다. 그럼 개별 변수의 비율을 읽어보겠습니다.
이번 사례에서는 독자의 이해를 돕기 위해 각 변수의 비율값을 아이콘 하단에 직접 표시해두었는데요. 오른쪽 변에 위치한 도보(노란색)는 50%로, 이동 수단 비율 중 절반을 차지합니다. 왼쪽 변에 위치한 대중교통(파란색)과 하단의 자가용(빨간색)의 이용 비율은 각각 25%로 나타납니다. 결론적으로 위 그림은 저자가 주로 도보로 이동한다는 사실을 보여줍니다! 삼항 플롯을 통해 개인의 주요 이동 수단과 그 비율 차이를 직관적으로 확인한 사례입니다.
3. 아직도 조금 어렵다면… 삼항 플롯 인사이트 도출 방법 3가지 기억하기!
혹시 그래도 어렵게 느껴진다면 단 3가지만 기억하면 됩니다! 삼항 플롯을 마주했을 때 곧바로 인사이트를 도출할 수 있는 방법 3가지인데요! 바로 확인해보겠습니다!
3-1. 원의 위치(Location)를 보라!

삼항 플롯의 첫 번째 인사이트 도출 방법은 바로 원의 위치(Location)를 확인하는 것입니다! 위 사례는 슈퍼히어로와 빌런의 능력치를 데이터로 활용한 시각화입니다. 변수 3가지로는 스피드(Speed), 힘(Strength), 지능(Intelligence)이 있는데요. 삼항 플롯 내에 분포된 원 하나하나는 히어로물에 나온 캐릭터를 나타냅니다. 원의 색상으로 캐릭터의 성향을 구분했는데요. 파란색은 정의로운 슈퍼히어로, 노란색은 중립적인 캐릭터, 빨간색은 빌런을 의미합니다. 원의 크기는 3가지 능력치의 합에 비례합니다.

삼각형 안의 영역은 총 4가지로 구분됩니다. 상단 영역은 스피드(Speed) 중심, 왼쪽 하단 영역은 힘(Strength) 중심, 오른쪽 하단 영역은 지능(Intelligence) 중심입니다. 중앙 영역은 3가지 능력이 고르게 발달된 상태(Balanced)를 의미합니다. 따라서 원이 위치한 영역을 기준으로 캐릭터의 능력치를 파악할 수 있습니다.

예시로 천천히 살펴보겠습니다. 3가지 능력 중 힘(Strength)에 가장 많이 치중된 캐릭터는 누구일까요? 삼항 플롯 중 왼쪽 하단 영역에서 어느 캐릭터인지 찾아볼 수 있는데요! 바로 빌런 솔로몬 그런디(Solomon Grundy)로 나타났습니다!

반면 삼각형 중앙 영역에 위치한 빌런 갤럭투스(Galactus)를 살펴볼까요? 분명 힘(Strength)이 100으로, 솔로몬 그런디(Solomon Grundy)의 93보다 높은데, 왜 중앙에 있는 걸까요? 바로 3가지 힘의 균형 때문인데요! 갤럭투스(Galactus)는 힘(Strength)도 세지만 스피드(Speed)와 지능(Intelligence)이 각각 83과 100으로 능력이 골고루 뛰어납니다. 이로 인해 갤럭투스(Galactus)는 중앙 영역에 표시된 것입니다. 반면, 솔로몬 그런디(Solomon Grundy)는 힘(Strength)은 세지만 스피드(Speed)와 지능(Intelligence)은 낮은 셈이죠.
3-2. 원의 색상(Color)을 보라!

삼항 플롯에서 인사이트를 도출하는 두 번째 방법은 원의 색상(Color)를 통해서인데요! 위 그림은 앞서 살펴본 사례와 동일한 콘텐츠로, 지역별 삼항 플롯을 그려 스몰 멀티플즈 형태로 구성했습니다. 개별 삼항 플롯에 분포된 각 원은 해당 지역에 속한 국가를 나타냅니다. 예를 들어 유럽을 의미하는 왼쪽 상단 차트에는 유럽 내 위치한 국가들이 원으로 표현되어 있습니다.
원의 색상은 3가지 이동 수단 중 가장 높은 비율을 차지하는 수단에 따라 달라집니다. 예를 들어, 어떤 국가의 인구 중 50% 이상이 도보(Active)로 이동한다면 해당 원은 노란빛을 띠게 됩니다.

이번 삼항 플롯에서는 원의 색상을 통해 각 지역의 주요 이동 수단을 파악할 수 있습니다. 그렇다면 가장 뚜렷한 특징을 지닌 지역은 어디이며, 주로 어떤 이동 수단을 이용할까요? 이를 확인하려면 색상이 가장 뚜렷하게 분포된 삼항 플롯을 찾으면 되는데요! 상단 중앙에 위치한 북미 (North America) 삼항 플롯을 살펴보면, 대부분의 원이 빨간색인 것으로 보아 자가용(Car)이 이 지역의 대표적인 이동 수단임을 알 수 있습니다.

반면, 특정 이동 수단에만 집중하지 않고, 두 수단 사이에서 균형을 이루는 지역도 존재하는데요! 바로 상단 왼쪽에 위치한 유럽(Europe)입니다! 이 지역의 원들은 삼항 플롯 안 오른쪽 영역에 분포되어 있으며, 하단일수록 자가용(Car)을 의미하는 빨간색(자가용), 상단일수록 도보(Active)를 의미하는 노란색으로 칠해진 모습을 볼 수 있습니다. 결론적으로 유럽에서는 자가용(Car)과 도보(Active) 사이의 이동 수단 선택이 균형을 이루고 있다는 점을 확인할 수 있습니다.
3-3. 원의 크기(Size)를 보라!

삼항 플롯에서 인사이트를 도출할 수 있는 마지막 방법은 바로 원의 크기(Size)를 확인하는 것입니다! 이번에 소개할 사례는 미국의 방송 3사–MSNBC, CNN, FOX–가 특정 키워드를 얼마나 자주 언급하는지를 시각화한 콘텐츠입니다. 삼항 플롯에서 3가지 변수는 방송 3사를 뜻하는데요. 삼각형 안에 분포된 원은 방송사에서 언급된 특정 키워드(예: ‘북한’, ‘무기’)를 의미합니다. 원의 크기는 방송 3사가 해당 키워드를 언급한 횟수의 합을 기반으로 결정됩니다.

크기를 중심으로 삼항 플롯에서 인사이트를 도출해보겠습니다. 우선 크기가 가장 크게 표시된 키워드는 ‘트럼프(Trump)’인데요. 마우스 오버로 세부 정보를 확인해보면, FOX는 36,217회, MSNBC는 76,187회, CNN은 50,958회 언급한 것으로 나타났습니다.

수많은 원이 분포한 삼항 플롯에서, 방송사에서 상대적으로 많이 언급된 단어들만 추려 본다면 어떤 인사이트를 발견할 수 있을까요? 이를 알아보기 위해 크기가 큰 원들이 삼각형 내에서 어떤 위치에 분포되어 있는지를 살펴보았습니다. 콘텐츠에 제공된 필터 기능을 활용해, 약 2만 회 이상에서 최대 17만 회까지 언급된 키워드만 추려보았습니다. 그 결과, 대부분의 큰 원이 삼항 플롯의 중앙에 위치해 있었습니다. ‘트럼프(Trump)’를 비롯해 ‘뉴스(News)’, ‘세금(Tax)’ 등의 키워드가 이에 해당합니다. 결론적으로, 크기가 큰 원들이 주로 중앙에 몰려 있다는 점은, 이 키워드들이 세 방송사 모두에게 자주, 그리고 중요하게 언급되었다는 인사이트를 제공합니다.
에디터의 한마디
오늘은 삼항 플롯의 개념부터 실전 연습, 다양한 활용 사례까지 차근차근 살펴봤는데요. 더 나아가 인사이트를 손쉽게 도출할 수 있는 방법 3가지인 1) 원의 위치, 2) 원의 색상, 3) 원의 크기에 대해 알아봤습니다. 조금은 생소하게 느껴졌던 삼항 플롯, 이제는 한층 친숙하게 느껴지시지 않나요?
삼항 플롯은 데이터의 3가지 변수 간 관계를 한눈에 파악할 수 있도록 도와주는 유용한 시각화 방식입니다. 다만, 유의해야 할 점은 삼항 플롯에 사용된 변수 3가지가 서로 어느 정도 연관성을 갖고 있을 때 그 활용도가 빛이 난다는 점인데요. 예를 들어, ‘주요 이동 수단’ 사례에서는 1) 도보, 2) 대중교통, 3) 자가용이 아닌 1) 도보, 2) 외식, 3) 성적이 변수라면 이들은 서로 연관성이 없으므로 삼항 플롯을 활용했을 때 유의미한 인사이트 도출이 어려워집니다.
처음 삼항 플롯을 보면 “와, 멋있다!”라는 인상으로 시작하지만 곧 “그래서 어떻게 읽어야 하지?”라는 의문으로 이어지는 상황이, 오늘의 글을 통해 조금은 해결되었을까요? 앞으로 삼항 플롯을 접하게 되었을 때, “멋있다!”에서 시작해 “해석할 수 있다!”로 자신 있게 외칠 수 있길 바라며, 글을 마무리하고자 합니다. 언제든 삼항 플롯에서 데이터를 읽는 방법이 궁금해지면, 다시 찾아와주세요!
<참고 자료>
- 강원양, “수치형 변수 3개 간 관계를 한 번에 알고 싶다면?”, 2018-05-22
- Geology Is The Way, “Interactive: how to use a ternary plot”
- Kelly Deuerling and Ryan Kerrigan, 2023, “How Do I Use Ternary Diagrams?”, Carleton Edu
- Ken Flerlage, “Experiments with Ternary Plots in Tableau”, 2019-07-31
- The Data Visualisation Catalogue, “Further Exploration #8 – Triangular Plots”, 2018-03-22
