シンポジウム「インターネット検索の未来」
本日、早稲田大学にて開催されたインターネット検索の未来シンポジウムを聴講してきました。
以下、かなり大雑把(かつ投げやり)にメモしておいたものを公開します。
(ちなみに公演の様子は、一部を除き、後ほどオンライン公開(動画?)されるとのことでしたので、そちらをワクワクテカテカしながら待つのも手かと…)
基調講演「ヤフーサーファーによるインターネット検索のノウハウ」
- 講師は 初代「検索の鉄人」 こと 関祐司さん。
- 現在の肩書きは「ヤフー株式会社 検索事業部 サーファー部部長」。部署名が(・∀・)カコイイ!!
(検索結果を人手でチェックしつつ、検索エンジンの性能評価等を行う部隊なんだそうです)
- 検索の5原則はRCFPT
- R: Relevancy (関連性、検索精度)
- C: Comprehensiveness (網羅性、包括性)
- F: Freshness (更新性、情報鮮度)
- P: Presentation (閲覧性、表示訴求)
- T: Trust (信頼性、信用度) ← これは上の4つにより実現される
- Web検索エンジンの仕組みの説明
(学生さん向けの簡単な説明でした。詳細は略)
- 検索テクニック
- Virtical Search
- いろいろあるので使ってね(登録サイト、画像、知恵袋など)
- 最近スタートしたブログ検索がオススメ。キーワードの注目度がグラフ表示される。
例えば 「食中毒」でブログ検索 した際に表示される 注目度グラフ を見ると、実は梅雨時よりも秋の方が「食中毒」というキーワードを含むブログが書かれていることがわかる。ちなみにグラフ上でマウスをドラッグすると、選択した期間に検索結果を絞り込むことができる。
- ページの吟味 (サーファー部ではこんな感じにページを吟味しています、的なtips)
- ドメイン・URLの確認
- 誰(どの団体)の情報であるか?
- いつの情報か?
- サイト内の他のコンテンツの確認?
- ドメイン内での再検索
- そのページにリンクしているページの確認
- アーカイブの確認 (with Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine)
- ページのトラフィック (with Keyword Research, Competitive Analysis, & Website Ranking | Alexa)
パネルディスカッション「検索の未来を語る」
- 参加者は
- 井上俊一さん(ヤフー株式会社 検索事業部 事業部長)
→ 井上俊一 / エッセンシャル・サーチエンジン - CNET Japan- 国枝学さん (NTTレゾナント株式会社 ポータル事業部本部 メディア事業部長
- 徳末哲一さん (ファストサーチ&トランスファ株式会社 代表取締役社長)
- 八尋俊英さん(経済産業省 商務情報政策局 情報経済企画調査官)
- 橋本大也さん (データセクション株式会社 代表取締役)
→ 情報考学 Passion For The Future- 山名早人教授(早稲田大学 理工学研究科 教授)
→Yamana Lab. – Yamana Laboratory, Waseda University.
- 山名先生(イントロ)
- 増加を続けるWebページ → 全体で375億ページ?
- 検索エンジンのインデックスは42億〜81億といったところ。これでいいんだっけ?網羅性は?インデックスすべきページの取捨選択は?
- 一般ユーザに使いにくい現在の検索エンジン。
- 未来の検索: 映像と言語情報の紐付けとか、感性・概念への拡張とか…
- 検索対象も、実世界・ユビキタスネットワーク上のものになるのでは
→検索解析共通プラットフォーム構想
- 日本は情報大航海時代における「強国」となるためには、今から正しい方向に舵取りをする必要がある
- 参考までにヨーロッパにおいても Quaero(クエロ)プロジェクトが発足している。
(参考:仏政府が「検索エンジン」開発計画、グーグルに対抗)
- 井上さん
- 「人々が相互をつながり知識共有できる世界最大のプラットフォームの提供」が目的
- 現状「Webページ=知識」なので検索サービスを提供しているが、今後は他のコンテンツに移っていく可能性も大いにある
- 現状の検索サービスの問題点
- 評判・意見の抽出ができない(esp 人によって解釈が違う問い 「女性が乗りやすい車?」)
- 個人の趣味・嗜好が反映されない(e.g 車のゴルフ vs スポーツのゴルフ)
- キーワードを入れないと何もでない(笑)
→ 1クエリあたりのキーワード数:1.36 word (2005/2), 1.45 word (2006/2)
- ソーシャル・サーチ
- コミュニティにたまっている知識をいかに共有するか?
- ソーシャルサーチの要素: コンテンツ、ソーシャルネットワーク、アカウント(他サービス連携のため)、マイ・ランク
- 国枝さん
- インターネットを利用する理由
- 調べ物 ← やっぱりこれが多い。従来型(目的があってwebを使う)
- 暇つぶし、なんとなく ← 何気にけっこういるらしい(目的がなくwebを使う)
- 「Web検索で問題が解決するか?」というアンケート(5万人対象)
- 約4割の人が、解決できていないと回答
- 「複数サイト/専門サイトを利用」という回答を加えると85%がWeb検索単独での解決に失敗
- 徳末さん
- エンタープライズ向け検索ソリューションの提供がメイン。
- 膨大かつunstructuredなデータをどう処理するか?
- 意味論的なインデクシング
- 検索サービスはむしろ始まったばかり。「理想的な」検索エンジンが実現されるには、まだあと10年〜20年は必要なのでは?
- 橋本さん
- ネット検索の今後
- インデックスのアルゴリズムの時代 → インタフェースとコミュニケーションの時代
情報を「引き出す」技術が鍵となる- インタフェース:
Google Maps (「藤沢市のラーメン屋」と検索した際でも、ちょっとドラッグすると隣町(鎌倉市)のラーメン屋情報(元のキーワードと直接リンクしないrelevantな結果)が表示される)
Google Suggest(ド忘れした単語をユーザより引き出す)- コミュニケーション: 対話の中から引きだす。
- 検索力 = アルゴリズム × インタフェース × コミュニケーション
- Webを、データベース以上の知識創造と共有のプラットフォームに作り変える次世代検索エンジンが求められているのでは?