ゲームとかアニメとか雑学とかのごった煮メモ書きページ since 2000.12.10

最近のトピック

意外に奥深い索引作り

 うなー、ふと気付いたら結構な時間に;。というわけで今日は書籍執筆の話から雑談を一つ。

 先日、ようやく前書きとかまで含めた校正作業が片付いたんですが、校正作業と並行して必ずやらなきゃいけない作業が一つあったりします。それは索引作りのためのキーワードのピックアップ。や、専門書であれば必ず付いてる索引ですが、あんなのかなり適当かつ自動的に作られてると思うじゃないですか。でも実際にはそうじゃなかったりして、結構面白かったりするんですよ。

 まず、インデックス付け(索引の作成)って実は『手作業で』キーワードをピックアップしてたりします。校正作業が一段落した時点(=ページが fix した時点)で、索引に使うキーワードに赤マーカを振っておき、あとは DTP 担当者がそこから一生懸命索引を作るという、実はかなりローテクな作業;。

 大手の出版社でもこんなローテクなのか? と最初はびっくりしたんですが、冷静に考えてみるとこれって実は当たり前。実際にマーキングしてみるとすぐに分かるんですが、単純にキーワードを拾って並べただけだと使い物にならない索引になってしまうんですよ。例えばこの blog で言うと、「くーちゃん」とか「Disneyland Park」といった単語を含むページ(エントリ)を自動的に拾うことはできますが、それだけではどのエントリが最もくーちゃんの魅力を熱く語ったページなのかが分からないんですよね。

 つまり、なぜ索引起こしを手作業でやるのかというと、単に重要キーワードをピックアップするだけではなく、そのキーワードに関するトピックのうちで『最も重要な内容を含むトピック』に対してのみ適切にインデックス付けをしなければならないから、なんですね。だから、それがたとえ重要なキーワードであっても、そのキーワードに関する説明になっていないページであればそのキーワードに対してはマーキングをしてはいけないんですよ。

 となると、実はこの索引付けもそんなに単純な作業じゃないんですね。つまり、『利用者の立場に立った場合、どういうキーワードの検索でこのページに辿り着くのか』を推測しなくちゃいけない。例えば、「かわいいすぎるんですけどくーちゃん^^」という文があった場合には、これにベタにマーキングしちゃいけないんですよ。こういう場合は、「くーちゃん」、「くーちゃんかわいい」、「くーちゃん萌え」、「萌えるくーちゃん」といったキーワードを立てておく。そうしておくと、利用者が「くーちゃん」というキーワードを元にこのページに辿り着きやすくなるんですね。つまり、場合によってはそのページ上に書かれていない単語でマーキングしなくちゃいけないことすらある、というのが索引作りの妙だったりするんですよ。

 加えて日本語の場合には、ピックアップしたキーワードを読み仮名順に並べたり、あるいはカテゴリ別に分けたりする必要があるので、どうしてもローテクにならざるを得ない。や、実はこのキーワードによるインデックス付けって結構奥が深いんですよねぇ。

 でもその一方で、そう考えると恐ろしくよく出来ているのが、Google などを初めとする Web サイトの検索システム。ご存知の方も多いと思いますが、Google の検索システムを支えている生命線は、「ページランク」と呼ばれる、ページの重要度を決めるアルゴリズム。ある Web サイトやページの情報価値が高いかどうかを、著名サイトや一般サイトからのリンクの数などに基づいて決める仕組みで、これによって、あるキーワードに対するあるページの情報価値をかなりの精度で推測してるんですね。や、なんかこういうのを見ていると思わず「私の本もインデックス付けして欲しいんですけど^^」状態になっちゃったり。

 や、一冊の本の中の索引付けということになるとページランクのような情報が取れないという問題もあると思うんですが、いずれにしてもこういう索引付けとかの作業は将来的には自動化して欲しいなぁと思ったりしなくもないです。……っていうかだってめんどいんだもん;。本質的な作業じゃないし;;。

投稿者 まちばりあかね☆ : 2006/4/14 01:56 | その他

トラックバック

このエントリーのトラックバックURL:
http://pasteltown.sakura.ne.jp/akane/games/blog/tt_tb.cgi/606


コメント

あなたがそこに持っている素敵なサイトでは、これは私のコメントを信用不良債権です, bad credit loans [url&eq;http://badcreditloansus.blogspot.com]bad credit loans[/url] bad credit loans

投稿者 bad credit loans : 2013年4月7日 04:58

コメントしてください




保存しますか? はいいいえ


< 2006年4月 >
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30