February 16, 2006

Googleと対峙する新技術(2)

・Googleと闘うところはサーチの世界一周以外にはない
・Googleのクローズこそオープン陣営が目指す急所
・まさかサーチにこんなアプローチがあったとは

これが、私たちのIPOの目論見書の骨子です。

なーんて調子いいこと書いて、これではまるでGoogleに対抗する新会社を興すみたいじゃありませんか^^;。

あくまで例え、例えばって話ですってば^^; > 村上さん

しかしそれにしてもこれを考えるだけでワクワクしてきますね。これを具体的に書き出すといろいろ差し障りがあるので、今回はいつもおかしい技術だと思っているサーチのパーソナライゼイションについて筆者の考えを述べておきます。

パーソナライゼイションの限界

パーソナライゼイションの限界の話しは、実はカテゴライズあるいはタグ化の問題と深く関わっていますが、話を拡げるとまとまりませんので、今回はそこにはふれません。

この話をするのに格好の話題を檜山さんが提供してくれています。少々長い引用ですが。(「子供も大人も変わらない -- 考えるって難しい 」から)

子供達とはよく遊ぶのだけど、お勉強は何も気にしてませんでした。ところがどうやら、ウチの子はデキが悪い。どんな感じかというと; 掛け算九九は暗記しています。10×n も機械的に反応できます。でも、「8×12」とか「11×11」になるともうダメ。そこで考え込むとか、筆算(もう習っている)をはじめるならいいのだけど、適当に「90」とか答える。「違う」「じゃ、100」「それも違う」「ええー、じゃ、105?」とこんな調子。

しょうがないヤツだ、とガッカリするのですが、まー、これはある意味「自然」なのかな、とも思います。掛け算九九ってのは、暗記が得意な子には苦痛ではないし、即答できることが(たぶん)快感でもあるのでしょう。2桁の掛け算になると「まだ憶えてないから、答えられなくても当然」という気分で、イイカゲンな答えを言っているようです。

掛け算九九をベースにして、筆算という手順(アルゴリズム)を遂行するのが面倒だし、そもそも、掛け算九九(1桁の掛け算)と2桁以上の掛け算の関連なんて意識してません(ホントに困るんだけど)。彼にしてみると、うざい筆算なんかより“掛け算九十九・九十九”の巨大テーブルを丸暗記したほうが楽なんでしょう。巨大テーブルを暗記したら、人より速く2桁掛け算を答えられるでしょうが、3桁の掛け算はまた当てずっぽう。

この九九の限界がそのままパーソナライゼイションの限界です。パーソナライゼイションとは簡単に言えば“嗜好のテーブル化”です。この嗜好のテーブルは九九のテーブルと同じで、一人一人中身は違うものの、それぞれ一つずつ割り当てられ、Google先生はこのテーブルを使って計算を行います。そうすると、この嗜好のテーブルにない計算(つまり異なる嗜好あるいはその組み合わせ)を求められても、檜山さんちのこどもと同じように当てずっぽうとまでも行かないにしろ、正解が得られないのは明白です。

それじゃあ、このテーブルを可能な限り大きくしたらどうか。やっぱりこれでもダメです。なぜなら九九のテーブルの縦横が数字であるのに対して、嗜好のテーブルの縦横は単語ですから、九九のテーブルで数字の同じ組み合わせの答えが一つであるのと同じように、嗜好のテーブルも単語の同じ組み合わせなら常に同じ答えを返してしまいます。これでは、例えば女性が妊娠して今までと嗜好ががらっと変わってしまったような場合とか、彼氏が自分のIDで彼女のかわりに検索してあげたとか、作家が登場人物毎のキャラで検索するとか、まあ考えればほとんどの場合通用しないことがわかります。

この問題の解決策はいろいろと提案され実用化されてはいますが、決定打がありません。

まあこのあたりがGoogleと対峙する新技術の一つと関わってくるってことまでで、この話は完。 KAI

投稿者 : February 16, 2006 01:34 PM | トラックバック
コメント
コメントする









名前、アドレスを登録しますか?