青空文庫

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

テンプレート:Selfref テンプレート:Infobox オンライン情報源 青空文庫(あおぞらぶんこ)は、日本国内において著作権が消滅した文学作品、あるいは著作権は消滅していないものの著作権者が当該サイトにおける送信可能化を許諾した文学作品を収集・公開しているインターネット上の電子図書館である。富田倫生野口英司八巻美恵らんむろ・さてぃの4人が呼びかけ人となって発足した[1]

概要

著者の没後50年を経て日本国内において著作権が消滅した、明治から昭和初期の作品が蔵書の大部分を占める。外国語作品の翻訳や著者自身により無償閲覧の認められた現代の作品もある。ジャンルは政治から趣味まで幅広いが、比較的文学作品(時代小説・探偵小説などの娯楽作品も含む)が多い。必ずしも著名な作品が全て揃っているとは言えないが、日本語作品に関しては相当充実してきている(外国語作品の場合、翻訳者の著作権の関係で、まだ数が少ない)。また、マイナーな作品を保存・紹介できる利点もある。作品の電子化は現在進行形で進められており、2011年3月15日、収録作品数が1万点になった[2]。古くは森鴎外夏目漱石芥川龍之介など、近くは中島敦(1942年没)、太宰治(1948年没)、林芙美子(1951年没)、宮本百合子(1951年没)、堀辰雄(1953年没)、坂口安吾(1955年没)、高村光太郎(1956年没)、永井荷風(1959年没)、吉川英治(1962年没)などの作品がある。

テキストファイルを作成する時に用いられる元の本を底本(ていほん)という。一部の底本では挿絵・図が添付されている場合もあるが、ほとんどの場合、文章の著者と挿絵の著者は別であり、著作権の消滅時期も異なるため文章だけの公開にならざるを得ない作品も多い。

各作品はボランティアの手によりJIS X 0208漢字の範囲で青空文庫形式テキストファイルやHTMLとして電子化されている。また、「青空文庫収録ファイルの取り扱い規準」に従い自由に利用出来るため、その収録作品はパーソナルコンピュータのみならずPDA携帯電話などの環境でも利用されている。テキストファイルである事から、大きな文字で印刷したり、テキストを読み上げるソフトウェアと組み合わせるなど、視覚障害者向けとしても利用が期待されている。

「青空文庫収録ファイルの取り扱い規準」に従っていればよいため、この無料の電子書籍を印刷して製本したり、独自のフォーマットで圧縮するなどして電子書籍として販売する業者もいる(例:ダイソー)。しかし、これにより青空文庫自体が利潤を得ている訳ではない。

青空文庫形式

テキストファイルを青空文庫に収録する際にテキストファイルが従わなければならない書式のことを青空文庫形式という。

特徴

青空文庫形式は、テキストファイルとして多くの環境で読む事ができるように規格化されている。できる限り底本の忠実な再現を目指しているが、改行や挿絵などの情報は原則として含まれない。

青空文庫形式に対応しているテキストビューアやテキストエディタもあり、ルビや傍点などの再現も可能である。また、これらのテキストビューアでは本来の青空文庫形式に含まれない挿絵の情報を挿入したり、縦書き表示にしたりすることも可能であり、テキストを読みやすくするための様々な機能が用意されている。これらのソフトウェアに関しては有料・無料問わず色々なものがある。

ルビの表記

ルビの表記は |と《》によって表現される。[3]ルビを《》で囲んだり|でルビのかかる文字列を特定するのは、視覚障碍者読書支援協会(BBA)[4]の原文入力ルールに合わせた[5][6]ものである。 テンプレート:Indent とあれば、「ぶんこ」というルビが「文庫」についていることを示す。 テンプレート:Indent のように、仮名と漢字の間に|が入る場合は|を省略することも出来る。 テンプレート:Indent のように、仮名にルビを強制的に振る時に使用することもある。

入力者注

底本の再現の補助として入力者注の形式も定められている。 テンプレート:Indent テンプレート:Indent のように傍点を入れたり、JIS X 0208漢字に含まれない旧字や外字などを説明したりする時などに使われることが多い。

問題

著作権保護期間延長問題

2003年以降、米国政府は「年次改革要望書」を通じ、日本政府に対して著作権の保護期間を「個人の場合は死後70年・法人の場合は公表後95年」に延長することを要求している。これを受けて文化庁は、2007年中に文化審議会著作権分科会で結論を得ると表明している。保護期間を延長する法改正が実際にされた場合、青空文庫は改正法の施行から最短でも20年間は新規の作品登録が困難になるおそれがあるため、2005年1月1日付けで反対声明を公表した。さらに、2007年1月1日からは同趣旨の請願署名を開始した[7]

日本国外では現に、エリック・エルドレッドEric Eldred)やオーストラリアプロジェクト・グーテンベルクの活動が著作権保護期間延長によって困難になってきている。青空文庫が延長反対を表明し、請願署名を行っているのも[8]、そうした前例を受けてのことである。

ケヶ問題

青空文庫の作業規定では、底本の「ケ」を「こ」「か」「が」と読む場合は「」に置き換えて入力するように方針を決めている[9]。例えば、底本に「霞ケ関(かすみがせき)」とある場合には、「ケ」を「が」と読むので「霞ヶ関」として入力する。さらに、青空文庫形式のファイル末尾の注釈に「※底本は、物を数える際や地名などに用いる「ヶ」(区点番号5-86)を、大振りにつくっています。」と注記する必要がある[10]

一方、作業規定の方針としては底本の文章は勝手な変更を加えずなるべく元のままで入力する規定もあり[11]、「ケ」を「ヶ」に置き換えしない方がいいとする意見もある。現行の作業規定に従うことに賛成するグループと反対するグループとの間で論争になっている[12]が、未だ決着は付いていない[13][14]

校正者不足問題

青空文庫では作品を入力する「入力者」と入力された作品を校正する「校正者」とは別々のボランティアが担当する[15]。そのため作品が公開されるまでには、作品を入力したあとで校正者が校正の予約をするまで作業状態が「校正待ち」となり、作業がストップすることになる。つまり入力者のボランティアが作品を入力しても校正者のボランティアが校正予約をして校正作業を完了しない限り作品を公開することはできない。そのため入力が完了しても作業状態が「校正待ち」のままになった作品が増加している[16]。これは入力者に対して校正者が不足しているためで、青空文庫が発足した当初から抱えている問題である[17]。この校正者不足問題に関しては、作品の校正作業なしで公開する案や、入力者による校正を認める案が提出されたことがあるが、これまでのところそれらの案は採用されていない[17]。寄付金を原資とした「有償校正」が2011年(平成23年)12月16日に公開された作品から始まった[18]

Unicode問題

青空文庫ではテキストの文字符号化方式Shift_JISを採用している。そのためテキスト入力に際して次の例のような置き換えを行っている。

テンプレート:JIS2004フォント外→森鴎外、内田百テンプレート:CP932フォント内田百間、大倉テンプレート:JIS2004フォント子→大倉※[#「火+華」、第3水準1-87-62]子

置き換えを回避するため、Unicodeの採用を求める声もあるが、包摂分離のための見直しを公開済みの全てのテキストに対して行わなければUnicode化はできないと主張する運営側と、公開済みの分は保留として新規分からUnicode化すべきと主張するグループとの間で対立が生じている。

関連書籍

関連項目

脚注

テンプレート:脚注ヘルプ テンプレート:Reflist

外部リンク

図書館OPACからの検索

「地域の文学」との連携

電子書籍端末からの利用

  • テンプレート:青空文庫
  • テンプレート:Cite web
  • HTML版工作員作業マニュアル 2.入力-1(青空文庫)→(5)特殊な表記
  • テンプレート:Cite web
  • テンプレート:Cite journal
  • 「リンク」ページ(青空文庫)
  • そらもよう 2005年01月01日 反対声明 (青空文庫)
  • 著作権保護期間の延長を行わないよう求める請願署名 (最終更新 2008年10月13日、青空文庫)
  • 区点番号5-17と5-86の使い分け指針 (青空文庫)
  • 青空文庫収録ファイルへの記載事項
  • 青空文庫からのメッセージ―本という財産とどう向き合うか
  • 青空文庫の掲示板[こもれび]で批難の応酬が続いていたが、決着を見ないまま2013年12月をもって掲示板は青空文庫のサイトから外された。
  • 賛成派の意見は「ケ」のように見える文字の入力について (富田倫生)を参照。
  • 反対派の意見は『「ケ」のように見える文字の入力について』批判(土屋隆)を参照。
  • 工作員志願者へのお願い (青空文庫)を参照。
  • 作業中 作家別作品一覧:全て(CSV形式、 zip圧縮)」によると、2010年(平成22年)1月29日の時点で「校正待ち」の作品は1695作品である。「校正待ち」の作品で最も古いものは戸坂潤の作品「現代唯物論講話」等で日付は2001年(平成13年)7月28日である。一方、「公開中 作家別作品一覧:全て(CSV形式、 zip圧縮)」によると、2010年(平成22年)1月29日の時点で「公開中」の作品は8736作品である。
  • 17.0 17.1 2010年(平成22年)01月18日付け「そらもよう」掲載のトレンドイーストによる校正支援を参照。
  • テンプレート:Cite news
  • 詳細は『青空文庫 全』寄贈計画のお知らせを参照。
  • 詳細は「青空文庫 全」DVDのBitTorrent配信を始めました(2009.3.7 MediaLab Love)および「青空文庫 全」DVDから2009/3/5までの差分配信を開始しました。(2009.3.9 MediaLab Love)を参照。
  • BOOK☆WALKER
  • テンプレート:Cite news