"웹로그분석"이라는 것을 처음 배울 때, 그러니까 대략 15년 전쯤... 새로운 개념에 익숙해지는 것이 가장 큰 과제였다.
같은 팀의 선배 동료가 "디멘션만 잘 알면 돼요"라고 했는데, 그 "디멘션"이라는 것 자체가 무엇인지 알 수 없었고, 어떤 것이 디멘션인지도 감이 잡히지 않았다. 당시 우리가 말하던 "디멘션"은 방문자수, 방문수, 페이지뷰 같은 지표들이었다.
그때 팀장님께서 바쁜 시간을 쪼개어 열심히 트레이닝을 해주신 덕분에 개념을 어느 정도 잡을 수 있었지만, 여전히 각각의 기준에 대해 헷갈렸다. 1년 선배였던 바로 옆자리 동료에게 물어보면, 그분 역시 "이거 매일 해도 헷갈리죠?"라며 웃으면서 계속 테스트를 해보자고 했다. 그렇게 부족한 개념을 조금씩 메워갔다.
지금 사용하는 GA4를 기준으로 보면, 우리가 "디멘션"이라고 배웠던 방문자수, 방문수, 페이지뷰 등은 사실 "측정항목(metric)"에 해당했고, "측정기준(dimension)"은 데이터를 분석할 기준이었다. 예를 들어, 연령대, 성별, 날짜, 국가, 유입 매체 등이 이에 해당한다.
그때는 왜 그렇게 헷갈렸는지 모르겠지만, 대부분의 고객도 방문자수와 방문수를 엄청 헷갈려했다. 그럴 때마다 팀장님이 설명해주셨던 예시를 활용해 설명하니 많은 분들이 이해할 수 있었다.
그 예시는 이렇다.
예를 들어, 제가 제 블로그에 오전 10시에 접속해 11시 40분까지 여러 포스팅을 읽다가(1시간 40분 동안), 11시 40분에 자리를 비워 점심 식사를 하고, 12시 30분에 다시 돌아와 포스팅을 읽기 시작한다고 가정해보겠습니다.
이 경우, 방문자수는 1명(저)이지만, 방문수는 2가 됩니다. 왜냐하면 30분 동안 아무 행동이 없으면 사이트를 떠난 것으로 간주하기 때문입니다. 이는 웹분석 업계의 표준입니다.
그럼에도 불구하고, 매일 데이터를 다루다가 어느 날 갑자기 "방문자수와 방문수의 차이를 알려주세요"라는 질문을 받은 적이 있다. 그 질문을 하신 분은 2년 동안 데이터를 봐왔던 분이었기에 정말 충격적이었다. 그런데 지금 그분은 꽤나 가까이에서 일하는 동료가 되었다.
데이터를 수집하는 사람이나, 수집된 데이터를 보고 의사 결정을 내리는 사람 모두가 가장 중요하게 여겨야 할 개념이 있다면, 나는 이것을 강조하고 싶다
데이터는 "측정기준(dimension)"과 "측정항목(metric)"으로 이루어져 있다.
이 개념은 너무 익숙해서 오히려 따로 구분하는 것이 어려운 것처럼 느껴질 뿐이다.
가장 대표적인 데이터의 예로 날씨 정보를 들 수 있다. 아래는 웨더아이에서 가져온 실시간 대기 정보를 기준으로 한 설명이다:
- 서울 중구, 서울 강동구 등은 측정기준(dimension)이다.
- PM10, PM2.5, 대기지수는 측정항목(metric)이다.
측정기준만 있거나, 측정항목만 있다면 의미 있는 데이터를 얻기 어렵다. 측정기준과 측정항목이 함께 있을 때 비로소 유의미한 데이터 분석이 가능하다.
데이터는 단순한 숫자 이상이다. 올바른 개념과 구조 안에서 분석할 때, 비로소 그것이 우리의 의사 결정과 행동에 의미 있는 영향을 줄 수 있다. 측정기준과 측정항목이라는 기초적인 이해가 탄탄할수록 더 큰 가치를 만들어 낼 수 있음을 믿는다. 결국, 좋은 데이터는 우리 모두를 더 나은 방향으로 이끌어 줄 것이다.