原稿No.200202-01
[Top]
書評リンク集をみんなで作る話題の抜粋
関連リンク:
[Top]
書評リンクの需要というのは常にあるので、いろんな人が書評リンク集を作ろうとするのですが、たいてい頓挫します。(私も頓挫したひとり)
その理由は……。
1.データ収集が困難
Google検索は、ノイズが多い。また、データ登録が遅い。
書評がありそうなところをいちいち廻るのは面倒。
掲示板等で情報を募集しても、自己申告してくれる人は少ない。
2.データ登録が困難
管理人がひとりで手作業で登録していくのは、大変。
書評ページの作者がわざわざ登録しにいくのは、面倒。
3.データのメンテナンスが困難
登録だけでも面倒なのに、さらに更新なんて……。
メンテナンスはともかく、データ収集と登録を自動化できないかというのが、リンク集を作ろうとしている人の希望なわけですね。
【はてなダイアリー】が注目されているのは、key word化によって、はてなダイアリー内にある日記から自動的にデータ収集できそうだと思われているからでしょう。
あとはWiki的に、key word を複数の人間が編集できるというのもポイントかな。
[Top]
●Wikiを使う
ひとりでデータ登録するのは大変だから、Wiki使って皆で登録すればいいじゃないかというのが、【みすらぼ日記:書評リンクについて】の意見。
でも、Wikiを入れたからといって、皆が登録してくれるとは限らないんですよ。Wikiは操作のとっつきが悪いので、普通の人は投稿しにくい。
【tDiary.org】でWikiがうまく機能しているのは、あそこがWikiの使い方に慣れたプログラマの多いコミュニティだからだと思います。
Wiki特有の機能を使いたいのではなく、単に複数人で編集したいというのだったら、むしろ書誌情報に特化した掲示板風のCGIを使ったほうが、まだとっつきやすいんじゃないでしょうか。
●複数人で登録できるCGIを使う
【極楽トンボ】さんが【書評リンクでもにょる】の中で言及していたのが、これ。
複数人で登録・編集ができるんですが、それでもデータ入力が手間なのと、入力データのチェック(いたずらデータ等の排除)で管理人に負担がかかるのが、うまくいかなかった理由のようですね。
●アクセス解析のリファラーで自動収集
私が考えていたのがこれ。
書評ページから、書籍データのページにリンクしてもらって、アクセス解析のリファラーからリンク元データを自動収集する。そのときリンクのURLにパラメータつけて感想リンクの有無を示す。
【一歩さんのBBS】提案してみたら、早速テストページを作ってもらえました。
リンクのテスト
リンクは、こんな感じ。リファラーは不正確だから、リンク元urlは明示的に入れたほうがいいということで
<a href=""http://ippo.s5.xrea.com/x/rl/index.cgi?cmd=input&code=ISBN4594035884&
review=alisato&url=http://alisato.cool.ne.jp/diary/200301b.html#14_t"
>書籍リンク集</a>
以下のようなツッコミもいただきましたです。
・「1回ジャンプ」のあとその登録用リンクどないすんねん邪魔だけやん
ってあたりが問題点か?
書評のあるページにいちいちリンクを記載しなくちゃいけないのは、面倒ですが、ネット書店へのリンクを貼るついでに記載するんだっだら、手間はかからないかなと思うんですが。
追記:2003/02/13
【たかはし】さんの【2002/02/09 ■ 書評リンク】にも同様のアイデアあり。
●書評ページのhtmlを検索して自動収集
一歩さんが考えたのがこれ。
書評のあるページに隠しタグなり独自のアンカーなりを入れておく。
あとから、書評のあるページのhtmlの中の隠しタグを拾って、リンク集に登録する。
隠しタグのフォーマットはこんな感じ。
<!--Tag:reviewlink-refer:ISBN4-06-273443-5:reviewer=評者:url=書評ページURL-->
以下がテスト用のページ。
【埋め込んだ書評タグを拾う】
書評リンクに参加しているサイトが、新着書評のページというのを作って、そこに上記のタグを記載しておけば、新着書評のページ更新があるたびにアンテナでチェックしてリンクを自動収集することも可能。
その場合の新着書評のページのソースはこんな感じで。
新着書評:<br>
<ul>
<li><a href="200301c.html#28_t2"
>[は] 榛名 しおり『レーヌスを渡る金狼』</a>:01/28</li>
<!--Tag:reviewlink-refer:ISBN4-06-255648-0:reviewer=Alisato
:url=http://alisato.cool.ne.jp/200301c.html#28_t2-->
<li><a href="200301c.html#28_t3"
>[し] 紫宮 葵『とおの眠りのみなめさめ』</a>:01/28</li>
<!--Tag:reviewlink-refer:ISBN4-06-255469-0:reviewer=Alisato
:url=http://alisato.cool.ne.jp/200301c.html#28_t2-->
</ul>
ついでにいえば、既存の書評リンク集から、上記のタグの形式でデータをひっぱってくれば、データをインポートすることも可能になる。
決められたフォーマットのタグを埋め込むだけだから、nDiaryを使う使わないは関係ない。html手打ちの人でも大丈夫。
このやり方は結構有望なんじゃないかと思う。
●各サイトの索引リストから抽出
(【Mystery Laboratory の書評リンク】に【フク】さん【著者順全部索引】に載っているデータを登録するのが大変だという話題の続きです。)
【フク】さんのデータを入力するのが大変だというのなら、手入力しないで【著者順全部索引】から著者名、書名、URLをスクリプトで抽出して、CSV(カンマ区切りデータ)にして、それをマスターデータにすればよいのではないかと思います。きれいに作られたHTMLなので、抽出は簡単なはず。
【Mystery Laboratory の書評リンク】のデータも、同じようにデータ抽出して(こっちはちょっと大変。でもテンプレートを使っているからなんとかなる)同じようにCSVにして、フクさんのデータにマージすればいいんじゃないかと。
で、CSVからHTMLを生成するなりWikiなりCGI用データフォーマットにぶち込むなりすればよいのではないかと。
一歩さんのプログラムで、書評リンクのキーをISBNにしているのは表記のゆらぎを避けるためなので(著者名などをキーにすると特に翻訳物は「バリー・ヒューガート」「ヒューガート」みたいに表記に違いがあって面倒)、この場合だったら、著者名+書名をキーにしてもOKだと思う。
オンラインで何かしようとすると大変ですが、nDiaryのためにRubyをインストールしてあるのなら、HTMLをローカルで保存して、自分のパソコン上でスクリプトで加工するのはそんなに大変じゃないです。(少なくとも自分で使う分には)
とりあえず、ちょこっと作ったスクリプト。
[fuku.rb]
[myslabo.rb]
[mislabo_html.rb]
おまけで抽出結果のlzhファイル
Rubyを勉強するのなら『たのしいRuby』(ソフトバンクパブリッシング ,2002.4,\2,600+税, ISBN4-7973-1408-7)【bk1/amazon/Yahoo!】 が、おすすめです。
HTMLからISBNを手がかりに書評っぽいものへのリンクアンカーを抜き出すというアイデアはナイス!
2000年11月ごろから書評系サイト(の一部)では、本の感想にネット書店へのリンクを添えるのが流行ってきたので、日付ないし話題にリンクアンカーのあるサイトだったら、2年分のデータはこれで半自動的に集めることができます。
【まつもとかなめ】さん作の【IEの右クリックで一歩さんの書評リンクに登録】のように、IEでISBNとアンカーを含む部分を選択し右クリックすると選択部分からISBNとURLを抽出し送信できるツールなんても作れるようです。
抽出したデータから、ボタンを何回かクリックするだけで、書評リンクデータを登録できるというのも便利。
何より便利なのは、ISBNに対応する書籍データを入力するときにネット書店のデータを「参照」できるということで、いちいち書名を入れなくて済むというのがこんなに楽だったとは!
試しに[本の感想:篠田 節子(1)]の書評データ&本のデータを抽出&登録してみたのですが、10件入力するのに10分かかりませんでした。すばらしい。
HTMLからの書評データの抽出機能と登録機能と参照機能はそれぞれ独立させたほうがいいような気もしますが、とりあえずテストしてみるのは面白いんじゃないかなと。
【みすらぼ日記】で、やりとりが続いています。
この書評リンク集の参加者は書評の索引リストを自分のサイトにおいている人が多いので、そこからスクリプトで書評データを抜き出すという方式でデータを取得するという方向で話がまとまったようです。
ただ、データ形式は、ISBNがなくて、著者名,書名,評者,URLという形式。
国内ミステリーは、ハードカバー、新書、文庫、再文庫化と版を変えて何度も出版されることが多く、ISBNよりも著者名+書名をキーにしたほうがよいと思ったので、そのように提案しました。
作家名から読みを知るリストの国内ミステリー作家版も作成してもらえそうな気配。
[Top]
[Home][Diary][Aliログ]
[nDiary用雛型・
原稿][生成]