포스트에 태그를 어떻게 달 것인가 (2) - 태그달기의 실제
2007/08/25 00:11
첫번째 포스트 "포스트에 태그를 어떻게 달 것인가 (1) - 색인은 왜 하는가"이후 시간이 많이 지났지만, 시간이 더 지난다고 좋은 내용이 나오지 않을 것 같아서 ㅠㅠ 2번째 포스트를 올립니다. 좋은 덧글 남겨주신 분들 정말 고맙습니다. 이번 글 이후 다음 글은 "포스트에 태그를 어떻게 달 것인가 (3) - 태그로 무엇을 할 것인가"가 될 예정입니다. ^^)/
------------------------------------------------------------------------------------------
지난번 포스트가 제목과는 달리 태그보다는 책 색인에 너무 집중했었는데, 이번 포스트는 온전히 태그에 대한 것입니다. ^^ 선후가 바뀐 것 같지만 먼저 태그(tag)의 정의에 대한 것으로 이야기를 시작해보도록 하겠습니다. 다들 잘 알고 계시겠지만 태그(tag)는 HTML에 사용되는 <ooo></ooo>들을 말합니다. 즉 태그 사이에 들어 있는 것에 대한 명령인 셈이지요. 그러나 웹2.0 이야기가 나오고 블로그의 영향력이 커지고, 태그를 이용해 주목받는 서비스들이 등장하면서 태그는 이제 서비스 이용자가 직접 입력하는 키워드를 통칭하는 말이 되었습니다. 이러한 변화에 이용자 중심이라는 의미를 부여하는 분들도 많지만 저는 단순하게 태그를 식당의 셀프 서비스처럼 ^^ 원래 검색에서 해야할 일을 이용자에게 떠넘기는 것/이용자의 자원(시간/노력)을 활용하는 한 방법이라고 생각합니다. "셀프 서비스를 도입해 물도 떠다 먹고 그럼 좀 불편하겠지만 가격을 낮춰줄게~" = "태그를 달라고 해서 따로 입력도 해야 하고 좀 수고스럽겠지만 좋은 검색결과를 제공해줄게~"
많이들 태그 하면 떠올리는 서비스 중에 하나인 플리커(Flicker)는 이러한 면에 딱 들어맞는 예라고 할 수 있는데, 이용자의 수고를 통해서 불가능한 일(문서안에 포함된 이미지도 아닌 그냥 생 이미지들을 어떻게 검색하란 말이얏!)을 성공적으로 해낸 대표적인 사례라고 할 수 있습니다. 플리커에서 일본 도시인 "osaka" 키워드를 태그 검색하면 첫번째 페이지 결과에서 한 이용자가 올린 오사카 남바의 노을지는 모습을 찍은 사진을 볼 수 있습니다.

이 이미지는 제목도 "Silhouette Namba"이고, 캡션도 "before the bright lights turn on"이기 때문에 순전히 사진을 올린 사람이 단 태그 3개 중에 하나가 "osaka"였기 때문에 결과에 나온 것입니다. 태그가 없었다고 해도 플리커의 검색엔진이 이 이미지만 보고 "앗 이것은 오사카 남바 지역이잖아! 사람들이 osaka라고 검색하면 보여줘야 겠군!"하면 나왔겠지만 아직 그정도까지 기대하는 것은 무리겠지요. ^^;;;

이처럼 태그는 검색엔진이 이해할 수 없는 형식의 데이터, 그러한 메타 정보가 절대적으로 부족한 형식의 컨텐츠에 대해서는 큰 위력을 발휘합니다. 즉 이전까지는 찾을 수 없는 데이터들이 태그를 달고 빛을 보게 되는 것이죠.
그렇다면 블로그 포스트처럼 텍스트로 되어 있어서, 검색엔진이 키워드로 색인을 해서 어떤 이야기가 들어있는지 잘 알고 있는 서비스에서 - 지금도 블로그 검색을 하면 중복이나 스팸의 문제는 있지만 꽤 만족스러운 결과를 얻을 수 있습니다 - 왜 태그가 필요한 걸까요? 그것에 대한 답변 또한 플리커에서 찾을 수 있습니다. 플리커에서 태그가 중요하다고는 하나 전체 검색을 하다 보면 제목이나 캡션에 들어 있는 용어들이 여전히 중요한 검색 대상이고 이용자들 역시 제목과 태그달기를 별개로 생각하지 않는 것처럼 보이는 예를 많이 보게 됩니다. 앞서 예를 든 osaka로 전체 텍스트 검색을 하면 239,594개의 이미지를, 태그 검색을 하면 189,851개의 결과를 찾을 수 있거든요. 그냥 제목검색을 하나 태그 검색을 하나 많기는 마찬가지 Orz
하지만 키워드를 좀 더 무형적이고, 사람들이 많이 찾지 않을 만한 것(롱테일성 키워드)으로 바꾸면 그 차이가 점점 벌어집니다. "happy"을 입력하면 전체 텍스트 검색 결과는 1,221,332개나 되지만 태그에서만 검색하면 243,144개 로 1/6이 됩니다. "pain"이라는 키워드는 전체 결과가 83,142개, 태그 검색결과는 18,506개가 되구요. 많이 찾지 않을법한 작곡가 이름 "falla"로 검색하면 전체 텍스트 결과는 4,610개, 태그에서만 검색한 결과는 862개가 나옵니다. 거기에 태그 검색결과의 첫번째 사진은 Manuel de Falla의 묘비 사진이구요.

이런 의미에서 태그를 검색에 이용한다는 것은 메타데이터가 있냐 없냐의 여부와 함께 그 대상이 되는 컨텐츠의 양도 중요한 역할을 한다는 것을 알 수 있습니다. 데이터가 늘어나면 늘어날 수록 일반검색보다는 태그를 통한 검색이 좀 더 원하는 결과에 가까운 것을 보여주게 되기 때문이지요. 또한 찾는 대상이 얼마나 대중적이고 인기있는 것이냐 아니냐도 큰 영향을 미칩니다. 이렇게 보면 블로그 포스트는 이미지와 다를바 없는 위치에 있다고 할 수 있는 셈입니다. 블로그 포스트의 양은 눈덩이처럼 늘어나고, 블로그 검색에서 롱테일성 키워드는 웹문서 찾기에서 만큼이나 의미가 있으며, 블로그 포스트 역시 이미지처럼 메타데이터가 없을 수도 있습니다.(이부분은 아래 5번에서 자세히~)그럼 이 3가지 측면에서 블로그에서 태그를 달 때 고려할 몇가지 사항을 정리해 보도록 하겠습니다.(편의상 번호를 붙여봤습니다.)
1. 태그를 통해 포스트를 접하게 된 이용자가 어떻게 생각할까?
우선 태그를 단다는 것은 검색의 대상이 되고, 다른 사람들이 자신의 포스트를 본다는 것을 뜻한다는 전제가 있어야 말이 되는 이야기입니다. 자신의 포스트를 좀 더 쉽게 찾기 위해서, 검색을 위해서는 포스트를 공개하지 않는다고 한다면 이런 점을 고려할 필요가 없기 때문입니다. ^^ 태그를 달 때는 그 태그를 통해 포스트를 접하게될 이용자가 어떤 느낌을 받을지, 어떻게 반응할지 고려하는 것이 필요합니다. 태그를 어떻게 다느냐에 따라서 "와 내가 원하는 그런 내용이라서 좋다"는 반응을 보일수도, 아니면 "아니 이런 내용인데 왜 이런 태그를 달아서 시간을 낭비하게 한거야!"처럼 부정적인 반응을 보일 수도 있게 됩니다. 예를 들어 [기담]에 대한 영화감상을 적은 글의 말미에 "... 이 영화를 보고 [검은집]을 볼 작정이다... "라는 이야기가 있다는 이유로 태그에 "검은집"도 입력한다면 "검은집" 태그 검색을 통해 해당 포스트를 접한 이용자는 짜증을 내겠죠? ^^ 그렇기 때문에 태그는 가급적 해당 포스트의 전반적인 내용과 관련이 있고, 일부와 관련이 있더라도 의미있는 내용을 담고있는 단어를 선택하는 것이 중요합니다. 태그달기의 첫번째는 검색하는 입장에서 자신의 포스트를 바라보는 것입니다.
2. 내가 다는 태그에는 일관성이 있을까?
영화평이나 책 소개 형식의 포스트, 또는 요리법, 구매기에 처럼 어느정도 일정한 형식이나 요소를 담고 있는 포스트에 대해서 태그를 달 때는 자신이 달고 있는 태그가 비슷한 범주의 포스트끼리 묶어줄 수 있는 충분한 일관성을 유지하고 있느냐의 여부가 중요합니다. 다른 사항과 달리 일관성 문제는 검색의 대상이 되는 포스트가 아니라, 개인적인 용도로만 태그를 사용할 때도 고려할 사항입니다. 예를 들어 자신이 읽은 책에 대한 포스트에 대해 태그를 달 때 번역자의 이름을 태그로 단다면, 해당 태그를 눌러서 본인이 읽은 해당 번역자의 번역서 목록을 볼 수도 있거든요. 태그 달기에는 정답이 있는 것이 아니고 태그를 떠받히고 있는 웹의 기본정신 - 흔히들 분산성과 자율성으로 이야기 되는 - 에 비춰 볼 때 전체적인 포스트에 대해 일정한 형식/기준을 적용하는 것은 불가능하지만, 자신이 작성한 포스트들 사이의 일관성은 이런 실용적인 이유때문이라도 유지할 필요는 있습니다. 무엇보다 일관성이 있으면 태그 달기가 쉬워지는 장점도 있지요. ^^
3. 너무 상위 범주의 단어를 태그로 사용한 것은 아닐까?
예를 들어 싱가포르 여행을 다녀온 두 사람이 비슷한 내용을 담은 여행기를 포스트에 올렸다고 했을때, 한 사람은 "여행", "여행기", "여행이야기" 를 태그로 달 수도 있고, 다른 한 사람은 이런 태그는 전혀 달지 않고 "멀리이언상", "래플즈시티", "리틀인디아" 같은 태그만 달 수도 있습니다. 좀 극단적인 예이긴 하지만 이 경우 저는 후자쪽이 좀 더 태그의 목적과 어울린다고 생각합니다. 간단히 말해 상위 범주의 단어는 여행, 사랑, 학교, 나무, 돌과 같은 일반명사를 말합니다. 범위가 상당히 넓기 때문에 검색어로 많이 사용되기 어렵고, 해당 단어가 담고 있는 뜻도 무척 많아서 모호한 단어들이죠. "동네"라는 태그 보다는 "OO동"이라는 키워드가 "나무"라는 태그보다는 "가문비나무"라는 태그를 달아주는 것이 필요합니다. 저는 이렇게 이야기하고 있지만 위에 말한 플리커에서 태그는 일반적인의 의미보다 훨씬 더 폭넓은 기준을 가지고 범주가 상당히 큰 태그 역시 권장하고 있습니다. 플리커 공식 도움말에서 추천하고 있는 태그달기가이드(Tagging it up ~ some suggestions for tagging your images)를 보면 animal, me, photo 같은 단어도 태그도 사용예로 나와 있거든요. 하지만 개인적인 생각에서 블로그 포스트에 있어 "생각"이나 "글"과 같은 태그를 다는 것은 태그 네비게이션을 통한 태그 순례 - 마치 슬라이드쇼 같은 - 에는 의미가 있겠지만 정보찾기 차원에서는 의미가 없다고 생각합니다.
4. 표기법에 맞는 단어를 태그로 선정했는가?
이 부분은 사실 태그를 다는 사람의 몫인지 아니면 검색을 제공하는 사람이 해야할 몫인지 잘 구별이 되지 않습니다. 하지만 태그를 다는 행위 자체가 어느정도 검색을 제공하는 사람의 입장도 되어 보는 것이라고 생각한다면 이 부분을 나몰라라 할 수는 없습니다. 표기법이 중요한 것은 "통일되지 않은 표기법이 태그로 달려 있는 포스트 = 존재하지 않는 포스트"가 되기 때문입니다. 아무리 정보가 많고 훌륭한 포스트가 있더라도 접근을 못한다면 소용이 없는 셈이지요. 표기법에 대한 대표적인 예로는 radar를 들 수 있습니다. "레이더" 또는 "레이다"로 표기되는 이 단어를 각각 구글에서 검색하면 레이다 688,000건, 레이더(표기법 상으로는 레이더가 맞습니다) 6,120,000건의 문서가 나옵니다. 뭐 우리가 몇 백만 건의 문서를 모두 다 볼 것도 아니고 두 표기를 혼용해서 사용하는 문서도 많지만 "레이다"라고 표기하고 있는 문서 68만 건에 내가 찾는 문서가 있을지도 모를 일 아닙니까? ^^ 이런 점을 고려한다면 태그를 달 때 그 태그가 일반적인 표기인지, 표기법에 맞는 것인지 확인할 필요가 있습니다. 외국어의 경우 개인적인 읽기로 태그를 달기 보다는 일반적인 읽기로, "스윙걸즈"가 맞는지 "스윙걸스"가 맞는지, 아니면 "우에노 주리"인지 "우에노 쥬리"인지 헷갈리고 둘 다 많이 쓴다면 둘 다 태그로 다는 것도 한 방법이 되겠습니다.
5. 포스트에 쓰지는 않았지만 태그로 삼을 만한 단어가 있지 않을까?
중요도/난이도 순서대로 나열한 것은 아니지만 마지막이 가장 고난이도의 태그달기 방법/고려사항이라고 할 수 있습니다. ^^ 예전에 책 색인을 할 때 가장 어렵고 경험이 필요한 작업은 본문에 언급되지 않은 단어를 뽑아내서 색인어로 삼는 것이었습니다. 식물의 호흡과정에 대한 설명을 담은 단락에서 "광합성"이라는 색인어를 뽑아내는 것이지요. 이런 방식을 태그달기에도 그대로 적용시키면 해당 포스트에 전혀 언급되지 않은 단어를 태그로 다는 것이 됩니다. 또 이것은 실제 본문에 언급되지 않은 키워드를 태그로 삼는다는 점에서 이미지에 태그를 다는 것과 비슷하고, 기계는 할 수 없고 사람만이 할 수 있다는 점에서 매력적인 작업이지요. 좀 더 쉬운 예를 든다면 네이트에 대한 포스트를 쓰고 본문에는 한 번도 쓰지 않은 "SK커뮤니케이션즈"라는 태그를 달아주는 것이 될 텐데, 비고 모텐슨이 출연한 [히달고]에 대한 이야기를 하면서 태그를 "아라곤"으로 다는 것이나, 김명민 직찍을 찍었어요~ 하는 포스트에 "장준혁"이라는 태그를 달아 주는 것도 넓게 보면 같은 차원의 이야기라고 할 수 있습니다. ^^
전체 내용을 요약한다면 태그를 단다는 것은 검색과 밀접한 관련이 있으며, 검색서비스나 포스트를 수집하는 검색엔진(크롤러)의 입장에서 블로그 포스트는 이미지 데이터와는 달리 텍스트라는 메터데이터가 풍부하지만, 대용량이고 롱테일성 키워드에 있어서 좋은 검색결과를 생각한다면 공통점이 있습니다. 따라서 그러한 점을 고려해서 태그를 입력하기 전에/입력하면서 고려한다면 좀 더 태그의 필요성/태그가 존재하는 이유에 맞는 용도로 사용될 수 있을 것이라고 생각했습니다. 다음 포스트에서는 그럼 태그를 달면? 그래서 뭘 할껀데? 라는 의문에 답하는 내용을 "태그로 무엇을 할 것인가"를 올릴 예정입니다. 마침 이글루스에서도 밸리에 주제별 테마의 인기 태그가 적용되어 이에 대한 이야기도 함께 해볼 예정입니다.
p.s. 텍스트 형태인 블로그의 태그와 이미지 서비스인 플리커의 태그를 같이 놓고 본다는 게 좀 무리이긴 하지만 개념적인 면에서는 다를바가 없기 때문에 플리커의 예로 시작했습니다. 물론 다른 태그 서비스를 잘 살피지 않은 게으름도 큰 작용을 했습니다. 죄송합니다. ㅠㅠ