World Wide Web
World Wide Web(ワールド ワイド ウェブ[1]、略名: WWW[2])は、インターネット上で提供されるハイパーテキストシステム。W3(ダブリュー スリー)[3]あるいは単に Web(ウェブ)[4]とも呼ばれる。インターネットは、コンピュータネットワーク自体を指す言葉であり、ウェブはその応用技術のひとつである。
目次
概要
WWW ではドキュメント(ウェブページ)の記述には主にHTMLやXHTMLといったハイパーテキスト記述言語が使用される。ハイパーテキストとは、ドキュメントに別のドキュメントのURLへの参照を埋め込むことで(これをハイパーリンクと呼ぶ)インターネット上に散在するドキュメント同士を相互に参照可能にするシステムである。
わかりやすい例で言うと、主にマウスによるクリックなどによってページ間を移動することや、別のファイルである画像をドキュメント内に表示させることなどが挙げられる。そのつながり方が蜘蛛の巣を連想させることからWorld Wide Web(世界に広がる蜘蛛の巣)と名付けられた。尚、蜘蛛の巣は現実のケーブルの配線を表しているわけではない。HTMLの記述方式は比較的単純なため、急速に広く普及した。
WWW にアクセスするためのソフトウェア(ユーザーエージェント)は WWW クライアントと呼ばれる。そのうち、利用者による閲覧を目的としたものは特にウェブブラウザ(WWW ブラウザ、あるいは単にブラウザ)と呼ばれる。また、WWW サービスを提供するソフトウェアを「WWWサーバソフトウェア」あるいは単に「ウェブサーバ」という。
検索エンジンとウェブディレクトリの出現により、WWW は徐々にその真価を発揮し始める。数学的な理論に基礎付けられたウェブページの順位決定法を実用化することによって、検索エンジンの首座は、一気呵成に確定した。それとは対照的に、すべての分野に亘って個々の事例の集積を要するウェブディレクトリの作成は、継続的で地道な作業によって成し遂げられる辞書の編纂と似ている。前者が数学的手法に依存しているのに対し、後者は分類学的手法によっている点が対照的である。
基本的な用語
WWW を参照するにはウェブブラウザなどのソフトウェアを使用する。ウェブブラウザはウェブページなどのドキュメントを WWW サーバから取得し、モニターなどの出力デバイスに表示する。ウェブページに含まれるハイパーリンクをたどることで他の文書を閲覧したり、情報をサーバに送ることで何らかの相互作用をもたらすこともできる。ウェブページはウェブサイトと呼ばれる関連情報を集めた単位でまとめられていることが多い。
「インターネット・サーフィン」という言葉は1992年6月に出版された「ウィルソン・ライブラリー・ビュレッティン」[5]の中のジーン・アーマー・ポリー[6](司書)の書いた文章から発祥しているという。ポリーは独自にこの言葉を生み出したかもしれないが、1991年から1992年にかけて Usenet で同様の言葉が散見された。更にそれ以前にハッカーのコミュニティで使われていたという証言もある。
英語では、「worldwide」と一語で表記するのが普通だがテンプレート:要出典、「World Wide Web」やその略記の「WWW」英語でも普通に使われるようになったテンプレート:要出典。最初の頃は、単語を連続して書いて単語の先頭だけを大文字にした 「WorldWideWeb」(インターキャップとかキャメルケースといわれ、プログラマが好む命名規則)とか、ハイフンが入った 「World-Wide Web」(英語の本来の使用法に近い)と表記されることも多かったテンプレート:要出典。
ウェブの仕組み
ウェブはクライアントサーバモデルに基づくシステムである。
World Wide Web 上のウェブページなどの資源にアクセスするには、まずウェブブラウザにURIを入力するか、ウェブページのリンクをたどればよい。すると、第一段階としてURIのサーバ名を表す部分がドメイン・ネーム・システム (DNS) と呼ばれるインターネットの分散データベースによってIPアドレスに変換される(IPアドレスが直接指定されている場合はこの変換は行われない)。
次に、そのIPアドレスに対応する WWW サーバに対して、URIのスキーム(通信方法などの指定)に従い接続を試みる。プロトコルとしては主にHTTPが使用される。一般的なウェブページでは、ページを構成するHTMLドキュメントや画像ファイルが要求され、即座に要求元に転送される。
ウェブブラウザは、受け取ったHTMLファイルやCSSファイルにしたがってレンダリングし、画像をはめ込み、リンクをはめ込むなどの仕事を行う。これによってユーザーが見ている画面上の「ページ」が生み出される。
多くのウェブページは他の関連するページとのハイパーリンクを含んでいる。それは例えばダウンロードのページだったり、ソース文書だったり、他の定義だったり、ウェブ上の何かの資源だったりする。このハイパーリンクによって情報の網(テンプレート:Lang-en)が形成される。これによって World Wide Web が構成されているのである。
歴史
ウェブの根底にある考え方は1980年にティム・バーナーズ=リーがロバート・カイリューと構築したENQUIRE (エンクワイア)に遡ることができる。その名称は「エンクワイア・ウィズィン・アポン・エブリシング」[7]というビクトリア朝時代の日常生活のハウツー本に由来していて、バーナーズ=リーが幼少のころを思い出して付けたものである。それは現在のウェブとは大分違うが、根本的なアイデアの多くを含んでおり、更にはバーナーズ=リーの WWW 後のプロジェクトである セマンティック・ウェブ の考え方をも含んでいた。しかし、ENQUIRE は一般に公表されるまでには至らなかった。
1989年3月、欧州原子核研究機構 (CERN) のティム・バーナーズ=リーは「Information Management: A Proposal」(情報管理: 提案)を執筆し、ENQUIRE を参照しつつさらに進んだ情報管理システムを描いた[8]。彼は1990年11月12日、World Wide Web をより具体化した提案書「WorldWideWeb: Proposal for a HyperText Project」[9]を発表した。実装は1990年11月13日から開始され、バーナーズ=リーは最初のウェブページ[10]を NeXTワークステーション上に置いた。
その年のクリスマス休暇の間に、バーナーズ=リーは WWW に必要な全ツールを構築した[11]。世界初のウェブブラウザ(ウェブエディタでもある)と世界初のWWWサーバである。
1991年8月6日、彼はWorld Wide WWW プロジェクトに関する簡単な要約[12]をalt.hypertext
ニュースグループに投稿した。この日がWWWがインターネット上で利用可能なサービスとしてデビューした日となる。
ハイパーテキストの概念は1960年代にまで遡ることができる。テッド・ネルソンのザナドゥ計画、ダグラス・エンゲルバートの oN-Line System (NLS) などである。ネルソンもエンゲルバートも、ヴァネヴァー・ブッシュのマイクロフィルムベースの夢の装置 memex の影響を受けたものであり、memex は1945年の論文「As We May Think」[13]で描かれている。
バーナーズ=リーのブレイクスルーはハイパーテキストとインターネットを結合したことである。彼は著書「Weaving The Web」の中で、このふたつの技術の結合は双方の技術コミュニティの協力によって成立することを強調しているが、誰もこの提案を取り上げることはなく、最終的に自分自身でプロジェクトを実行したのである。この過程で彼はURIと呼ばれるグローバルな資源識別子を開発した。
World Wide Web は当時実現していた他のハイパーテキストシステムとはいくつかの点で異なる。
- WWW は、双方向ではなく単方向のリンクを使用する。これにより、何らかの資源の所有者と連絡を取らなくてもリンクすることが可能となった。これによって WWW サーバやブラウザの実装も簡単になっているが、同時にリンク先の資源がいつの間にか無くなるという問題も発生させることとなる。
- HyperCardやGopherとは違い、World Wide Web は特定の個人や組織によって独占されておらず、サーバやクライアントを独自に開発し拡張するのも自由にできて許諾を得る必要も無い。
開発当初、WWW は文字情報を扱うだけの比較的単純なものであった(NeXT上で開発されたためOS自身が文字以外を適切に扱うため、WWW は情報を区別しなくてもよかったというのが真相)。しかし1992年、イリノイ大学の米国立スーパーコンピュータ応用研究所 (NCSA) によって、現在のように画像なども扱えるようになった。同校の学生であったマーク・アンドリーセンらは文字だけでなく画像なども扱える革新的なブラウザ Mosaic を開発。そしてこのソフトに改良を加えるために無料でソースコードを公開したため、Mosaic はたちまち普及し、WWW は誰でも手軽に使うことのできる世界的なメディアとなった。
1993年4月30日、CERN は World Wide Web を無料で誰にでも開放することを発表した。
日本最初のホームページを開設したのは、高エネルギー加速器研究機構所属の森田洋平である。
WWWの標準規格
WWW を構成する根本的な標準規格が3つ存在する。
- Uniform Resource Identifier (URI) は、ウェブページのようなWWW上の資源を参照するための汎用のシステムである。
- Hypertext Transfer Protocol (HTTP) は、ブラウザとWebサーバの通信方法を指定したものである。
- HyperText Markup Language (HTML) は、ハイパーテキスト文書の構造と内容を定義している。
WWW で使われる技術は従来IETFのRFCにより標準化されてきたが、現在は非営利組織である World Wide Web Consortium (W3C) によって標準化が進められている。現在、バーナーズ=リーはW3Cを指導する立場である。W3Cは上記を含めた様々な標準を開発・保守し、WWW上のコンピュータが様々な形態の情報を格納してやりとりできるよう尽力している。
JavaとJavaScript
もうひとつの技術上の大きな発展はサン・マイクロシステムズの Java である。Java によって、小さなプログラム(アプレット)を直接WWWサーバが提供する情報に埋め込むことを可能にした。このアプレットはクライアント側のコンピュータ上で動作し、高速で豊かなユーザインタフェースを可能とした。その後、Java はサーバ側で複雑なコンテンツを自動生成するために広く使われるようになった。
JavaScript はウェブページのために開発された、クライアント側のスクリプト言語である。ネットスケープコミュニケーションズが開発したものである。名前の一部に「Java」を含んではいるが[14]、技術的には Java との関係はほとんどない。文法はC言語に似ている。オブジェクト指向的にコーディングする以外に手続き的にコーディングすることもできる。
DOMと組み合わせることで、JavaScript はその設計者が想像した以上に強力な技術となった。JavaScript の使用はそれまでの静的なHTMLページと区別するためにダイナミックHTML (DHTML) と表現されることが多い。さらに近年は JavaScript を使って、よりインタラクティブなウェブサイトを作ることのできるAjaxという技術も普及している。
社会科学的影響
今日の WWW は人類の歴史上かつてないスケールで個人間の情報交換を可能とした。時間的空間的な隔たりを越えて、本質的かつ広大な思想や逆にちょっとした個人の姿勢や心情をWWWを通して交換したり発信したりすることができるようになったのである。
感情的な経験、政治的考え方、文化習慣、音楽の風習、ビジネスについての助言、芸術、写真、文学などが、人類史上最も安価にデジタル化されて共有・拡散される。WWW はそれを支える技術と設備の上に成り立っているが、図書館や活字による印刷と違って物理的な形を持たない。そのため WWW(あるいはインターネット)を通した情報伝播は物理的な量に制限されないし、情報をコピーする手間もかからない。またデジタルの利点として、WWW 上の情報は簡単かつ効率的に検索でき、他のどんな通信手段(郵便、電話など)や実地の旅行よりも早く情報を集めることができる。
すなわち WWW は今まで地上に現れた個人の情報交換媒体としては最も広範囲で遠くまで伝達可能なものである。多くのユーザーが世界各地の人々と情報交換し、他の手段では不可能だったことを可能とするだろう。
WWW は社会交流を促して、膨大な知識の集積を育み、個々人の地球規模の理解を深める役に立つと示唆する人もいる。一方、多くの人々を仮想世界に閉じこもらせ、好戦性を増大させ、地球規模の管理・支配体制を生み出すのに使われる可能性も持っているとも言われる。
統計
2001年の研究[15]によれば、ウェブ上の文書は5500億個以上も存在し、その多くは「深層Web」にあるという。
2002年の20億以上のWebページを調査した結果によると[16]、英語のコンテンツが56.4%で最も多く、以下、ドイツ語 (7.7%) 、フランス語 (5.6%) 、日本語 (4.9%) となっていた。これ以降、中国語のページの増加が目立っている。
2005年1月では[17]、75種類の言語でWeb検索を行ってサンプリングし、一般に検索可能なWebは少なくとも115億ページ存在するとの結果を得ている。
2006年2月では[18]、静的なページだけでも150億ページ以上、動的に生成されるページを含めると350億ページ以上が存在するとの推定がある。
WWWの読み方
英語では「World Wide Web」より「WWW」の略称が一般的。ただし、皮肉なことに、「WWW」の方が「World Wide Web」よりも音節数が多く(下記)、発音するのにかえって時間がかかる。バーナーズ=リーによれば、他の人はそれを理由に名前を変えるように助言したが、バーナーズ=リー本人がこの名称に固執したとのことである。
英語圏では、「WWW」は「double-u, double-u, double-u」と発音される(「W」も参照)ため、音節数が6つないし9つになる[19]が、一方の「World Wide Web」は音節数が3つしかない(en:Pronunciation of "www"も参照)。
ニュージーランドでは「doub, doub, doub」と発音されることが多く、これは英語表現中でより簡潔である。
脚注
- ↑ 厳密には The World Wide Web(ザ ワールド ワイド ウェブ)だが、ここでは便宜上、「the」(ザ)を省略する。
- ↑ 発音上は、略名であるはずの「WWW」の方が「World Wide Web」よりも長い。#WWWの読み方も参照。
- ↑ http://www.w3.org/ The World Wide Web Consortium (W3C)
- ↑ 厳密には the Web(ザ ウェブ)である。
- ↑ Wilson Library Bulletin
- ↑ Jean Armour Polly
- ↑ Enquire Within Upon Everything
- ↑ The original proposal of the WWW, HTMLized
- ↑ http://www.w3.org/Proposal
- ↑ The World Wide Web project
- ↑ Tim Berners-Lee: WorldWideWeb, the first Web client
- ↑ http://groups.google.com/groups?selm=6487%40cernvax.cern.ch
- ↑ http://www.theatlantic.com/doc/194507/bush
- ↑ 開発された当初は LiveScript と呼ばれていたが、当時、爆発的な人気を誇っていた Java 言語にあやかって、この名前に改名された。(JavaScript#歴史 を参照。)
- ↑ BrightPlanet - The 'Deep' Web: Surfacing Hidden Value
- ↑ Distribution of languages on the Internet
- ↑ The Indexable Web is more than 11.5 billion pages
- ↑ Fact of The Web
- ↑ 『Merriam-Webster英英辞典』によると、「double」の標準的な発音は \ˈdə-bəl\ で、2音節ある。
関連項目
- ウェブサイト
- コーポレートサイト
- Webプログラミング
- CMS(コンテンツマネージメントシステム)
- セマンティック・ウェブ
- 検索エンジン
- ウェブディレクトリ
- ウェブマイニング
- ハイパーテキスト
- ストリーミング
- Web 2.0 - これはWWWが単なるWebサイトの集合体からWebアプリケーションを提供するプラットフォームへと変化していくことを表す用語として使われる。
外部リンク
- World wide webcams
- 日本最初のホームページ
- WWW黎明期の歴史と立役者
- Open Directory - World: Japanese: コンピュータ: インターネット: ウェブデザイン・開発
- ウェブ工学の研究室
標準規格
以下は、World Wide Web の基本的な3つの標準規格を定義した文書のリストである。
- Uniform Resource Identifier (URI)
- RFC 1738, URL Specification (updated by RFC 3986 "Uniform Resource Identifier (URI): Generic Syntax" in January 2005)
- HyperText Markup Language (HTML)
- Hypertext Transfer Protocol (HTTP)
- RFC 1945, HTTP version 1.0
- RFC 2068, HTTP version 1.1
- RFC 2616, HTTP version 1.1 (updated)