2007/08/15 14:14
원래 포스트에 태그를 어떻게 달 것인가? 라는 포스트를 1개로 올리려고 하다가 태그와 색인의 유사성에 대해 이야기 하던 것이 길어져서 아예 색인에 대한 글을 먼저 따로 올리게 되었습니다. "포스트에 태그를 어떻게 달 것인가 (2) - 태그달기의 실제"도 기대해 주삼 ^^)/
------------------------------------------------------------------------------------------
제가 첫직장에 들어가서 기본적인 일들을 배운 후에 바로 하기 시작해서 퇴사하기 전까지 했던 일이 색인(index)을 하는 일이었습니다. 전산쪽의 인덱싱(indexing)이 아니라 책 보면 맨 뒤에 있는 색인, 찾아보기, 인덱스의 그 색인을 만드는 일이었지요. 단순하게 쪽수를 나열하는 색인이 아니라, 구미식으로 해당 표제어가 위치해 있는 곳에서 어떤 의미로 사용되고 있는지를 짧은 문장으로 기록하고, 또 비슷한 것은 묶어주는 식이었습니다. 이런 색인작업은 전문분야로 인정받는 것도 아니고 ㅡ.ㅡ 국내에서는 피었다가 스러진 것이 아닌 아예 별도 직업으로 나타난 적도 없었고(인덱서라는 말 너무 생소하잖아요 ^^), 국내 번역서에서 색인은 참고문헌이랑 함께 아예 날리는 경우가 허다하고, 국내서에서 따로 색인을 공들여 넣는 경우가 거의 없기 때문에 2번째 직장을 구하면서 큰 어려움을 겪었습니다. Orz (결국 업종을 바꾸게 되었습니다. ㅠㅠ)
아래 서구쪽에서 사용하고 있는 색인의 예를 하나 들어보겠습니다. 스티븐 제이 굴드의 [인간에 대한 오해 The Mismeasure of Man](사회평론)의 번역서에는 아예 색인이 누락되어 있는데 - 딱히 사회평론만 그런 것은 아니지만 책값이 25,000원인데 참고문헌, 색인을 모두 날려버리는 용기는 어디서 나오는 것인지 궁금합니다 - 아마존의 책 내용보기 기능을 보면 다음과 같은 충실한 색인이 들어 있는 것을 확인할 수 있습니다.

위의 [The Mismeasure of Man]에 대한 색인을 보면 루이 아가시(Louis Agassiz)에 대해 언급이 된 쪽수 23, 52, 74~83, 102, 142, 144, 398이 나열되어 있고 바로 아래 들여쓰기가 되어서 "doctrine of human unity of" 76, 77-78, "miscegenation and" 76, 80-81, "Morton and" 82-83, 84, "as taxonomic splitter" 76 이렇게 4줄이 추가되어 있습니다. 이것을 우리나라식으로 정렬하면 다음과 같습니다.
아가시, 루이(Agassiz, Louis) 23, 52, 74~83, 102, 142, 144, 398
견해
분류상의 분화 76
이종족간 결혼 76, 80-81
모턴과의 관계 82-83, 84
인류의 단일성에 대한 학설 76, 77-78
즉 아가시에 대해 언급되어 있는 페이지는 각각 23, 52, 74~83, 102, 142, 144, 398쪽이고, 아가시가 이종족간 결혼에 대한 의견을 말한 부분이 있는 곳이 76쪽, 80-81쪽, 아가시와 모턴의 관계에 대해 언급하고 있는 곳은 82-83, 84쪽이라는 이야기죠. 일반적인 쪽수색인의 경우는 아래한글의 기능을 이용해서 작업을 할 수도 있고, 기본적으로 편집자가 저자가 진행 가능한 일이지만, 색인이 좀 더 제 역할을 해주려고 하면 단순한 쪽수 나열을 넘어서서 위의 예처럼 책 전체의 내용을 조직화해주고 색인만으로도 해당 쪽수를 찾아가지 않아도 어떤 내용이 있겠구나... 하는 것을 알려주는 길라잡이 역할을 해야 합니다. 이것을 검색, 태그와 연결시켜 생각해 보면 쪽수 색인은 해당 키워드가 들어간 모든 문서를 나열해 주는 방식이라고 할 수 있습니다. 이에 비해 조직화된 색인은 해당 문서를 분류해서 보여주는 방식이라고 할 수 있겠죠.
예를 하나 더 들어보겠습니다. 에버렛 M. 로저스의 [개혁의 확산 Diffusion of Innovtions](커뮤니케이션북스)은 번역본이 580쪽 되는 책인데 이 책의 색인은 5쪽이 있습니다.(사실 없는 경우도 많으니 있다는 것에 감사해야 합니다 ^^) 원서는 518쪽으로 색인은 인명색인이 5쪽, 주제색인이 10쪽으로 나눠서 모두 15쪽의 색인이 있습니다. 같은 색인주제어인 의견 지도력(opinion leadership)이라는 색인항목을 비교해 볼까요? [원서색인보기]


내용의 조직화와 분류라는 의미에서 보면 소설과 같은 문학책은 색인이 필요 없고 - 시집에 색인 하는게 무슨 의미가 있겠습니까? 할 수도 있겠지만 ^^ - 특히 위에 예를 든 [개혁의 확산]과 같은 방대한 분량의 책에서 색인은 이런 역할을 톡톡히 해주고 있음을 알 수 있습니다.
다시 한 번 검색, 태그와 색인을 연결시켜 본다면 위의 원서 색인을 통해서 이용자는 자신이 찾고자 하는 문서를 좀 더 쉽게 찾을 수 있다는 말이 됩니다. "의견지도력의 특징"을 알고 싶어하는 독자(이용자)는 위의 색인에서는 바로 293-304쪽을 찾아 가겠지만, 아래 색인을 이용하는 사람은 나열된 10곳을 모두 뒤져 봐야 한다는 결론이 나오죠. 현재의 이글루스 검색에서 미야베 미유키라는 키워드를 입력했을 경우 이용자는 수백개의 포스트를 보게 되는데 여기에는 단지 미야베 미유키가 언급만 되어 있는 "오늘 이사카 코타로랑 미야베 미유키 책을 샀다"는 내용의 포스트도 포함이 됩니다. 하지만 만약 태그검색으로 미야베미유키를 검색한다면 미야베 미유키와 관련도가 높은 25개의 포스트만 보실 수 있습니다.
그럼 유용성면에서 다들 좋아좋아 하지만 거의 국내 출판에서 색인은 무시되어 왔던 이유는 무엇일까요? 곰곰 원인을 따져보면 1. 색인의 특성상 최종 교정이 끝나고 쪽수가 다 자리 잡힌 후에 진행을 해야 하고, 색인작업을 하기 위해서 색인자(indexer)는 책의 내용을 편집자만큼 파악하고 수작업(외국에는 색인을 위한 보조 프로그램도 있습니다)으로 색인을 진행하기 때문에 전반적으로 마감일정을 늘려야 하는 부담감도 있고, 2. 색인작업의 특성상 본문의 오타나 통일되지 않은 표기들의 수정사항이 발견되기 쉽기 때문에 색인을 통한 교정이 전체 일정에 고려되지 않은 상태라면 역시 일정이 예상치 못하게 늘어지는 문제가 있어서 그런가 하는 생각을 했습니다. 하지만 그러한 진행상의 어려움을 떠나서 가장 큰 원인은 역시 3. 색인이 있으나 없으나 큰 문제가 없었기 때문이 아닌가 싶습니다. 즉 색인을 했을 때 들어가는 비용이나 시간대비 얻을 수 있는 것이 별로 없는 셈이지요. 따라서 우리나라 출판현실에서 정교한 색인은 아예 진행되지 않는 것이 당연시 되며, 기본적인 색인이 필요할 경우에는 최종 작업이 끝난 후에 편집자가 1-2일 정도 쪽수 색인을 만드는 경우가 대부분이었습니다.(하지만 요즘에는 그나마 쪽수색인도 보기 힘들어 진 것 같아 슬픕니다. ㅠㅠ)
(이야기가 출판쪽으로 흘렀지만 다시 돌아오면) 이것을 태그와 연계해 생각해 보면 블로그에 있어서 태그도 비슷한 문제점을 갖게 될 가능성이 커보입니다. 블로그 포스트에 열심히 색인을 다는 사람들도 있지만(국내 출판사중 1-2곳은 충실히 색인을 합니다) 대부분은 포스트에 태그를 달지 않습니다. EBC를 보면 태그에 대해서 "태그란 본문 내용에서 핵심이 되는, 사용자가 직접 입력한 단어(또는 구문)들을 말합니다. 일반적으로 태그는 글을 분류하기 위한 목적으로 사용하는데, 카테고리로 분류하는 방식과 비교하여 보다 동적이고 유연하게 분류할 수 있다는 장점이 있습니다"라고 되어 있지만 그 장점이, 태그로 잘 조직화된 포스트가 넘치는 이글루스를 제가 사용할 때 느낄 수 있는 편리함이 구체적으로 실감이 나지 않습니다. 짧은 글이나 일정한 양식의 글이라면 규칙을 정해서 태그를 달긴 하겠지만 자신의 생각을 담은 긴 글에 대해서 태그를 달려고 하면 어떤 단어를 태그로 삼아야 할지, 어떤 형식으로 태그어를 지정해야 할지 난감해 집니다. 포스트 쓰는 만큼 시간이 들지는 않겠지만 역시 추가로 시간이 들긴 하겠죠. 그렇게 시간을 들여 넣은 태그가 유의미하게 사용된다는 보장도 없구요. 물론 이글루스에서 조만간 밸리를 태그 클라우드를 보여주는 방식으로 개편한다고 하지만 아마 어느정도 태그가 활성화 되면 도입하겠죠?
전체내용을 요약하다면, 조직화되지 않은 덩어리라는 면에서 단행본이나 블로그 포스트는 같은 면이 있습니다.(만약 단행본의 색인어들을 모두 모아서 나열하고 중복되는 것을 크고 진하게 표기한다면 그게 태그 클라우드와 뭐가 다르겠습니까? ^^) 검색을 필요로 하지 않는 소설이나 시집을 사적인 일기와 같은 포스트와 같다고 볼 수도 있겠고, 검색 대상이 될만한 포스트들은 무언가 1차작업이 필요한 일반 단행본이라고 볼 수 있습니다. 따라서 블로그 포스트에 태그를 단다는 것은 텍스트에서 의미있는 주제어(색인어)를 뽑아내고/선정하고, 비슷한 주제를 묶어준다는 공통점이 있습니다. 다음 포스트에서는 "태그달기의 실제"라는 제목으로 구체적인 태그달기의 방법을 적어보겠습니다.