JIS X 0213
テンプレート:JIS2004 JIS X 0213(ジス X 0213)はJIS X 0208:1997を拡張した、日本語用の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である。
2000年に制定、2004年、2012年[1]に改正された。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれる。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれる。
JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。
目次
[非表示]特徴
JIS X 0212(補助漢字)が頻度調査を中心に追加文字を選定し、典拠用例などは諸橋漢和への参照情報を付加した程度だったのに対し、JIS X 0213ではJIS X 0208:1997 (97JIS) においてJIS X 0208の収載字体の用例・典拠を徹底して調べ上げ、同定したのと同様の手法で一般に使われる字(狭義の字体。以後「字」は狭義の「字体」を指す)でJIS X 0208に収録されていないものを追加した。そのため、JIS X 0212と同じ字が含まれていることもあるが、JIS X 0212では収録されていてもJIS X 0213では包摂規準を使って特に増やさなかった字がある。
拡張にあたっては、JIS X 0208の1997年改訂で保留領域とされた部分に字を増やす方針で行われ、非漢字659字、第三水準として1249字、第四水準として2436字を追加した。実装では、JIS X 0208:1997で保留領域とされた部分に非漢字及び第三水準の文字を入れて第一面とし、その後ろに第四水準の文字を第二面として加えた。さらに2004年の改正で、第三水準に10字が追加され、168字の例示字形が変更された。
第二面は第一面と同じく94区94点で構成されているが、そのうち文字の存在する符号領域は1, 3–5, 8, 12–15, 78–94区に限られる。この奇妙な配置はJIS X 0212補助漢字の存在する場所を避けた結果である。これによりEUCエンコードされた文章でJIS X 0212補助漢字を用いたものとJIS X 0213第二面を用いたものの判別が可能である。さらに両方を用いることも原理的には可能だが、ただしその規格は存在しない。
しかし、JIS X 0208:1997で保留領域とされた部分は、過去のJIS X 0208で自由領域とされ、実装各社によって外字領域として使用されていた部分であり、実態としては既に使われている領域であった。ここに新たに文字を配置した規格案に対し実装各社側より意見があり、最終審査において各種符号化方式が「参考」(規格本体ではない)とされることになった。その一方で、JIS X 0208の空き領域を規定通り未使用としていたUNIX系ソフトウェアでは対応が比較的容易であり、複数の実装が存在する。
JIS X 0208から追加された文字の概略
- 非漢字
- 記述記号 - 逆疑問符、二分ダーシ、ダブルハイフン等
- 音声記号類 - セディーユ 、マクロン、声調記号等(合成可能含む)
- 準仮名・漢字 - くの字点、ゆすり点、ます記号等
- 括弧記号 - ダブルミニュート、二重括弧、ギュメ等
- 学術記号 - 空集合、アレフ、エイチバー(プランク定数)等
- 単位記号 - ユーロ記号、リットル等
- 一般記号 - 著作権表示記号、トランプ記号、ビュレット、斜め矢印等
- ローマ数字(大文字・小文字)
- 分数
- 拡張ラテン文字 - ダイアクリティカルマーク付きラテン文字各種
- 平仮名 - 半濁点付きのか行(鼻濁音)、「ヴ」「ヵ」「ヶ」に対応する平仮名
- 片仮名 - 半濁点付きのカ行(鼻濁音)、濁点付きのワ行、アイヌ語表記用片仮名
- ギリシア文字 - ファイナルシグマ(語末形)
- 丸付き数字、丸付き英小文字、丸付き片仮名
- 歯種記号左上、左下、右上、右下、正中過剰歯、上顎、下顎、(波付、波なし)
- 国内実装互換 - 組文字の「トン」、「ドル」等
- ラテン1 (ISO/IEC 8859-1) 互換 - ソフトハイフン、上付き数字、ノーブレークスペース
- 漢字
文字の表記方法
JIS X 0213ではJIS X 0208まで用いられていた「区点」に「面」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。
符号化方式
JISベースの文字コード
符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004、Shift_JIS-2004、EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。 Shift_JIS-2004は、Mac OS XやJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS(コードページ932)と互換性がないことを理由に実装していないため、広く利用することができない。
Unicodeとの対応
JIS X 0213制定当時はいくつかの文字に対応するUnicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、
- 漢字の内CJK互換漢字領域に追加されたものを除くと基本多言語面 (BMP) 外のCJK統合漢字 拡張B領域に追加されることとなった。該当する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、UTF-8では4バイト長コードに、UTF-16ではサロゲートペア(代用対)に対応する必要がある。UTF-32に対応している場合はそのまま使用可能である。
- 例えば1面14区2点の点の付いた「テンプレート:JIS2004フォント」はU+2000Bに割り当てられた。
- 非漢字の内半濁点付き仮名、アクセント付きIPA記号で従来のUnicodeに単独の符号として無いもの、声調の上昇調、下降調を示す記号は2つのUnicode符号を組み合わせて表すこととなった。該当する文字は全部で25字ある。これらをOpenTypeで使用するには、オペレーティングシステムやアプリケーションが、OpenTypeのグリフ置換機能に対応する必要がある(この場合グリフ置換のうち、複数の隣り合うグリフをある一つのグリフに置換する機能を使用)。
- 例えば1面4区87点の半濁点付き「テンプレート:JIS2004フォント」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。
- 1面11区69点の声調記号上昇調および1面11区70点声調記号下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記号のうち複数が隣り合うと、上下の声調変化を示す記号ができるというものである。
なお、Windows Vista以降やMac OS Xではこれらに対応している。Windows XPではサロゲートペア(代用対)に対応しており、Service Pack 2以上を適用することによってグリフ置換にも対応する。Windows 2000はサロゲートペアに対応しているものの初期設定では無効化されておりレジストリの設定が必要である(Help:特殊文字#古代文字と人工文字参照)。またグリフ置換には未対応である。
アプリケーション側の対応も必要である。Microsoft OfficeのXP以降のバージョンやWindows Vistaに付属するInternet Explorer 7.0、Windows XP以降に付属するメモ帳やワードパッドなどでは対応済みである。
ほかの実装方法
- JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が実装されていなかったため、外字領域に文字を定義して使用することが多く行われていた。いくつかのフリーフォントではそのような実装が行われている[2]。
- 日本のデータ放送などで使用されるARIB STD-B24では、ARIBの文字符号化方法の文字セットとしてJIS X 0213が使用可能となっている。「JIS互換漢字1面集合」でJIS X 0213:2004の1面、「JIS互換漢字2面集合」でJIS X 0213:2004の2面が使用される。この符号化方式の中には「国際符号化文字集合」を使用する方法があり、通常のUnicodeのマッピングのほか、「BMPセット」としてUnicodeでの「基本多言語面」ですべてを表現できるようにJIS X 0213での「追加漢字面」の文字を「基本多言語面」の外字領域にマッピングしなおした文字セットが別に使用可能とされている。
- JAVA 7では通常のShift_JIS-2004形式の実装(x-SJIS_0213)のほかShift_JIS-2004にMicrosoftコードページ932を上書きした符号化方式(x-MS932_0213)に対応している。
先行国内実装との互換性
JIS X 0213の第1面13区には、PC-9801から続く機種依存文字とされてきたNEC特殊文字が、一部を除き同じ面区点番号で登録されている。
このため、これまで典型的な機種依存文字として挙げられてきたNEC特殊文字を使った文書がShift_JIS-2004として解釈できるようになった。
JIS X 0213:2004の改正
変更のあった文字(新字形) |
---|
テンプレート:JIS2004フォント |
変更前の字形 |
テンプレート:JIS90フォント屢テンプレート:JIS90フォント |
字体の変更前後の比較 |
JIS X 0213の字体の変更前後の比較 |
例示字形の変更
JIS X 0213:2004は、JIS X 0213:2000の例示字形を変更している。変更があったのは右表の通りである。
全部で168字あり、おおむね、拡張新字体から、いわゆる康熙字典体型へ変更されている。「叉」や「釜」などは筆押さえを取っている。また、「蟹」(「解」と「虫」を離した)や「祟」(出を小さくした)などのようにどこがどう変更されたか一見しただけでは判別しにくいものもある。このように変更点が極めて微細な文字は右の表にて背景色をテンプレート:Bgcolorとした。
この変更は、国語審議会の答申「表外漢字字体表」に示されている字体に合わせるものである。ただし、文字コード規格とは文字の符号化表現を定めるものであり、例示字形は何ら規範的な役割を持たないことを謳っていながら、こうした変更を行うことに対して批判的な意見が公開レビューなどで寄せられた。 テンプレート:-
追加された10文字
追加された10文字 |
---|
テンプレート:JIS2004フォント |
従来の文字 |
テンプレート:JIS2004フォント |
第3水準に追加された10字は右表の通りである。Unicodeで別の符号が与えられていたために追加されたものである。これらは表の下に示した従来の文字に対する異体字である。
フォントの対応
- Microsoftは、2007年に発売したWindows Vistaから、標準搭載フォント[3]の字形を旧来のJIS X 0208:1990のものから、JIS X 0213:2004のものに変更した。また、旧来の字形を表示できるフォントパッケージも公開された[4]。
- Appleも2007年発売のMac OS X v10.5において、例示字形の変更に対応したヒラギノ Nフォントを追加している。
- IPAがLinuxなどのOSで使用するためのフリーフォントとして公開しているIPAフォントもフォントの字形をJIS X 0213:2004のものに変更した[5]。
上記対応によりほぼすべてのOSにおいてJIS X 0213:2004の字形が標準で使用可能となった。
JIS X 0213:2004では、JIS X 0213:2004で規定されているすべての文字種が含まれていて、各文字がJIS X 0213:2004での包摂基準に従っており、JIS X 0213:2004で規定されているそれぞれの文字の区別がつけることができる(たとえばJIS X 0213:2004での異体字関係となる「神」と「テンプレート:JIS2004フォント」が違う字形となっている)ことが求められているだけであり、例示字形と完全に同一の字形であることが求められているわけではないので、JIS X 0213:2004の包摂基準範囲内で自由に字形を選択してもJIS X 0213:2004に従った字形(たとえば「辻」が二点之繞でなくてもJIS X 0213に従った字形)ということができる。ただし、一般的にJIS X 0213:2004に従った字形のフォントとして発売されているフォントは、二点之繞や食偏なども含めてJIS X 0213:2004の例示字形に沿った字形を選択しているフォントがほとんどである。
ただし、一部JIS X 0213:2004のコードポイントが割り当てられているにも関わらず、同じ字形であるがためにUnicodeのコードポイントの全てに対応していないフォントも少なからず存在する。以下にそのケースを挙げる。
以上の3つは、JIS X 0213:2004対応のフォントを使用しても、その全ての表示が保証されるわけではない[6]。ただし小文字 (ð, đ, ɖ) に関しては、形状が全て異なるため、JIS X 0213:2004対応フォントで全て表示させることが可能。
JIS X 0213:2012の改正
2010年11月30日の常用漢字表改定に対応して、引用例の変更、附属書12の追加がなされた[1]。
参考文献
- テンプレート:Cite book(2000年1月20日制定)
- テンプレート:Cite journal
- テンプレート:Cite journal(2000年3月24日)
- テンプレート:Cite journal
- テンプレート:Cite journal
- テンプレート:Cite book
- テンプレート:Cite book(2004年2月20日改正)
- テンプレート:Cite journal
- テンプレート:Cite journal
脚注
関連項目
外部リンク
- テンプレート:PDFlink
- テンプレート:PDFlink - 2004年改正では2面には変更なし
- JIS漢字コード表の改正について(経済産業省プレス)
- 小形克宏の「文字の海、ビットの舟」——文字コードが私たちに問いかけるもの
- JIS2004文字コードについての法務省の説明
- 新JIS漢字時代の扉を開こう!
- JIS X 0213の代表的な符号化方式
- XANO明朝フォント JIS X 0213:2004 全グリフを収録した無償TrueTypeフォント
- IPAフォント(一般利用者向け許諾にあわせJIS X 0213:2004対応)
- ↑ 以下の位置に戻る: 1.0 1.1 テンプレート:Cite web
- 元の位置に戻る ↑ 新漢字則 (JIS X 0213:2004) にあるイオが作成した「Windows 9x/NT を JIS X 0213 対応にするパッチ」はそのような実装が行われている例である。
- 元の位置に戻る ↑ 「メイリオ」、「MS ゴシック3書体(MS ゴシック、MS Pゴシック、MS UI Gothic)」および「MS 明朝2書体(MS 明朝、MS P明朝)」がJIS X 0213:2004対応フォントである。
- 元の位置に戻る ↑ 「Microsoft Windows Vista:JIS X 0213:2004 対応と新日本語フォント「メイリオ」について」を参照。
- 元の位置に戻る ↑ 2007年10月に公開したIPAフォントVer.2からJIS X0213:2004に準拠した。詳細はテンプレート:PDFlinkを参照。
- 元の位置に戻る ↑ 例えば「ヒラギノ角ゴ ProN W3」では、Ð (U+00F0) 以外に対応していない。