안녕하세요, 데이터 시각화 전문 기업 뉴스젤리입니다.
데이지 업데이트 기능 전격 분석! 시리즈가 3회에 걸쳐 진행된다고 말씀드렸는데요, 오늘이 아쉽게도 그 마지막 시리즈… <기술&통계편>입니다. 마지막까지 잘 지켜봐 주세요. 🙂
<기술&통계편> 역시 핵심 3가지 업데이트로 소개 드리려고 해요. (하지만 사설을 붙일 수도 있다는 점…!!) 기술&통계 부분의 업데이트는 눈물 없이 볼 수 없는 개발팀의 대대적인 작업이 진행되지만, 프로그램을 다루는 분들이 아닌 이상 쉽게 그 변화를 눈치챌 수 없지요…. 그래서! 오늘은 에디터가 맘 먹고 여러분들과 함께 공유하려고 해요. 어떤 기술적인 부분이 변경되었을까요?
공공데이터의 경우, 지속적으로 데이터가 업데이트되지만 기존 버전의 데이지에서는 한 번 차트&그래프를 생성하면 변동된 사항을 반영하기 힘들었어요. 즉, 공공데이터 검색 –> 데이터 시각화의 과정을 같은 데이터로 2번, 3번씩 했어야 했지요.
하지만 데이지1.1(1.1.1인가 1.1.2인가 1.1.3인가…!!)에서는 공공데이터가 변경되면, 이전에 만들었던 차트&그래프가 바로 변환된답니다! 번거로이 차트를 다시 만들 필요가 없어졌어요!!!!! 완전 편리한 부분! *.*
기존 추천 방식은 데이터의 다양한 패턴을 확인 후 가장 적합한 차트를 추천해주는 방식이었습니다. 하지만 무수히 많은 데이터에 대해 어떤 차트가 가장 합리적이다, 라고 말하기 어려운 부분이 있었어요.
예를 들어, ‘모바일 인터넷 접속시간’이라는 데이터를 활용하고자 한다고 가정할게요.
이 데이터가 성별, 연령대별, 학력별, 직업별 모바일 인터넷 접속시간을 시간 단위로 나타냈다고 했을 때 ‘나’에게 필요한 차트&그래프가 각각 다를 수 있죠. 성별 모바일 인터넷 접속시간은 파이 차트로, 연령대별 모바일 인터넷 접속시간은 막대 그래프로 강조하고 싶다고 했을 때 기존 모델에서는 학습 알고리즘으로써 ‘이거 가장 추천해! 적합할 듯!’ 하고 특정 한 가지 유형이 화면에 나타났거든요. 사용자가 원하는 차트&그래프로 다시 변경해야 했어요.
데이터의 형태에 따라 추천하는 시각화 유형이 각각 다르기도 하구욥. 즉, 유저가 데이터를 통해 어떤 ‘유의미한’ 해석을 하느냐에 따라 시각화 유형이 바뀔 수 있는 부분이거든요.
그래서 업데이트했습니다!!!!! 유저가 선택한 변수에 대해 그려질 수 있는 모든 차트를 보여주고, 유저가 원하는 차트를 선택하여 사용할 수 있도록 하는 로직으로 변경되었습니다. 🙂
하지만, 데이지의 핵심 기능 중 하나가 ‘추천 기능’인 만큼, 비슷한 패턴의 데이터는 많이 사용된 차트를 상위에 노출 되는 개념으로 개발되었어요. (격한 감격…!!)
‘범주형 변수’로 이루어진 데이터를 효과적으로 나타낼 수 있도록 업데이트되었습니다. 여러 가지 범주와 이에 속한 다양한 변수 속에서 데이지(DAISY)는 ‘제일 (숫자) 큰 놈 나와!’ 로 표현되었어요. 즉, 가장 높은 빈도를 보이거나 값이 큰 데이터를 불러와서 시각화했죠.
데이지1.1 버전에서는 통계 기능이 추가되면서 수치형 변수 집계 방법이 다양해졌습니다. 😀
보이시나요?! 합산, 최소, 최대, 평균, 중앙값 중 선택해서 데이터를 볼 수 있어요.
이제 엑셀에서 셀을 쭈~욱 드래그해서 ‘(=average)’ 하거나 내가 보고 싶은 데이터를 가져와서 따로 편집하는 수작업이 필요 없어졌단 말씀!!!!! 한층 스마트해진 데이지입니당.
이 외에도 5MB까지만 로딩 없이 구현되던 데이지가 데이터 크기에 상관없이 수용할 수 있도록 안정화되었다던가, 데이터 정제가 가능해지는 등 다양한 기술들이 개발되고 반영되고 있어요!
많은 것들을 소개해드리고 싶지만, Deep해지기 때문에 이 정도에서 마무리할까 해요. 더욱 편리한 기능들로 데이터 시각화&인사이트를 도출할 수 있도록, 더 많은 유저들에게 사랑받을 수 있도록 노력하겠습니다.
데이지1.1 업데이트 기능 전격 분석 1,2,3탄을 이것으로 마치며…!!
2017년도에는 더 멋진 데이지 솔루션의 기능들을 가지고 돌아올테니 그때까지 잠시만 기다려주세요!
Stay Tuned –
감사합니다!