無料ブログはココログ

最近読んだ本

« 濱野智史「アーキテクチャの生態系」(1) | トップページ | 濱野智史「アーキテクチャの生態系」(3) »

2011年5月15日 (日)

濱野智史「アーキテクチャの生態系」(2)

第二章 グーグルはいかにウェブ上に生態系を築いたか?

WWW」(World Wide Web=以下ウェブと表記)の特徴はハイパーリンクやハイパーテキスト、つまり複数の文書間をジャンプできるようにする、という仕組みにある。これは1980年代後半CERM(欧州原子核研究所)の研究員が、このようなハイパーテキストの発想をインターネットという通信システムと組み合わせて開発したものだ。彼は、世界中の大学や研究所で同じ研究をする研究者の論文などの文書情報をインターネットを通じて効率的に公開・共有するシステムを考えた。かりに、研究者相互で電子メールを使って文書ファイルのやり取りをした場合には、新しい文書を作成するたびにファイルのやり取りをし、ファイルを更新しなければならない、さらに複数のバージョンがバラバラに拡散してしまうため、最新のバージョンが行き渡っているか分からなくなることもある。それならば、どこか1か所のサーバーに文書ファイルを集約すればいいということになるが、今度は誰が管理するのかという問題が生ずる。そこで、彼は各研究者が自分の管理しているサーバーに自分の文書を設置しておいて、他の研究者は必要な時にその文書を読みに行くという仕組みを構築した。そして、どこのサーバーにどのようなファイルがあるのかというデータの所在を表現するための仕組みとして、「ハイパーリンク」や「URL」が実装された。つまり、世界中に散らばったファイルから、必要な情報を指定し、すぐにジャンプして取り出せる仕組みとして、ウェブ及びハイパーリンクは構想された。

その後、インターネットの普及に伴い、利用者やサーバーが増えてくる。これに伴い、ハイパーリンクという情報共有の方法は、その文書の数が増えれば増えていくほど、その処理できる情報の量に限界が生じてくる。認知限界と呼ばれる問題で、文書ファイルの数がたくさんあり過ぎると、どこに何かあるかを探すのに、人の認識能力では限界が生じることになる。そこで検索エンジンが登場する。当初の検索エンジンは、人力で収集されたリストだったので情報量が足りなかったり、検索技術が未熟だったりと、性能がいいとは言えなかった。

これがグーグルの登場により、劇的に変化する。グーグルは検索結果の精度を飛躍的に高めたが、それは「ページランク」という仕組みに起因する。ページランクとは、①まずグーグルは、ウェブ上に膨大に存在するウェブサイトの「リンク構造」を「ポット」と呼ばれる自動巡回プログラムによってつぶさに追跡し、②「数多くのページからリンクされているページは重要と看做す」「その中でも重要なウェブページからリンクされているページは、より重要なものとみなす」といったアルゴリズムに従って、膨大なウェブページのランク付けを行い、③基本的にページランクの高いものから、グーグルの検索結果の上位に表示していくと言うものだ。とりわけ重要なのは、②の重要性をランク付けする方法だ。それが画期的だったのは、ウェブページに書かれた「内容」によって重要性を判定するのではなく、ハイパーリンクと言う、文章の内容とは直接関係のない部分に注目した点にある。グーグル自身は、この仕組みを投票にたとえている。

このような仕組みはウェブのリンク構造を解析することで優れた検索結果を導くというものだが、言い換えれば、グーグルはユーザーたちのリンクを貼るという行動を、その検索結果の精度を高めるための協力ないしは貢献として、利用していることになる。グーグルの検索結果が優れているのは、あくまで人がウェブ上から情報を探し出し、それをリンクによって指差すという行動結果(協力結果)に基づいている。

このようなグーグルによる検索の仕組みは、間接的に、かつ無意識に人を貢献、協力させるという点で「アーキテクチャ」の特性を備えたものと言える。

« 濱野智史「アーキテクチャの生態系」(1) | トップページ | 濱野智史「アーキテクチャの生態系」(3) »

書籍・雑誌」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 濱野智史「アーキテクチャの生態系」(2):

« 濱野智史「アーキテクチャの生態系」(1) | トップページ | 濱野智史「アーキテクチャの生態系」(3) »