五十音順
五十音順(ごじゅうおんじゅん)とは、日本語の仮名文字を順序決めする規則である。あいうえお順とも言う。五十音の「あいうえお」に始まり、「わ(ゐ)(ゑ)(を)」に至る順序である。五十音に含まれない「ん」は通常「を」のあとに置かれる。
語句を並べる際には、おおよそ、本来の表記に関係なく(五十音のみで)仮名文字表記した場合の辞書式順序となる。つまり、まず1文字目を比較し、1文字目が同じ場合は2文字目を比較し、2文字目までが同じ場合は3文字目を比較し、以下同様である(語句の終わりが来た場合は「あ」より前となる、つまり、あ<ああ<あああ)。ただし、五十音以外の濁音・小仮名・長音符等の扱いはやや複雑である。
表記に基づく場合に比べれば発音に近いが、あくまで「仮名文字表記」を比べるため、発音とは一致しない。
用例
国語辞典や書籍の索引などを始め、人名や商品名を並べる場合などに、一般的に広く用いられる。
最初の五十音順の事典は1884年の『日本百科事彙』(田口鼎軒編)である。
公用文作成の要領では、人名・件名を並べるときは五十音順に並べるよう定められている。
基本の順序
- あ
- い
- う
- え
- お
- か
- き
- く
- け
- こ
- さ
- し
- す
- せ
- そ
- た
- ち
- つ
- て
- と
- な
- に
- ぬ
- ね
- の
- は
- ひ
- ふ
- へ
- ほ
- ま
- み
- む
- め
- も
- や
- ゆ
- よ
- ら
- り
- る
- れ
- ろ
- わ
- ゐ
- ゑ
- を
- ん
詳細規則の例
「あいうえお」から「ん」に至る順序に関してはほとんど定着しているが、濁音・半濁音・長音などの扱いに関しては、ある程度一般的な決まりはあるものの、国語辞典などでもそれぞれで規定するなど若干の揺れがある。
JIS X 4061 に規定されている場合は、それを原則として述べる。
- 濁点・半濁点は無視する。無視した際に同じ語になる場合は、濁点・半濁点なし(清音)→濁点→半濁点の順とする。「ゔ」等も同様である。
- (は→ば→ぱ→はあ→ばあ→ぱあ→ひ)
- 別の例:濁音・半濁音は、清音と別の文字として扱う。順序は、清音→濁音→半濁音の順とする。
- (は→はん→ば→ばん→ぱ→ぱん→ひ)
- 別の例:「ヴァ・ヴィ・ヴ・ヴェ・ヴォ」は「バ・ビ・ブ・ベ・ボ」と同一視する。
- 長音符(ー)は、直前の母音(あるいは「ん」)と同一視する。同一視した際に同じ語になる場合は、母音→長音の順とする。(長音符を使わない長音は表記どおりの順序とする)
- (ああく→あーく→ああけ)
- 別の例:長音符は無視する。無視した際に同じ順位になる場合は、長音符なし→長音符ありの順とする。
- (ああく→あく→あーく→あけ)
- 別の例:長音符は独立した別の文字として、「ん」の次に置く。
- (あわ→あん→あんわ→あー→あーん→い)
- 小仮名、つまり、拗音の2文字目・促音「っ」などのは、大きい字と同一視し、同一視した際に同じ語になる場合は、大きい字→小さい字の順とする。
- (きや→きゃ→きやく→きゃく→きゆ)
- 「わ」行の「ゐ」「ゑ」「を」は「わ」の後とする。
- 別の例:「ゐ」「ゑ」「を」は「あ」行の「い」「え」「お」と同一視する。同一視した際に同じ語になる場合は、「あ」行→「わ」行の順とする。
- 「ゝ」「ヽ」は直前の仮名文字を繰り返す。「ゞ」「ヾ」は直前の仮名文字に濁点をつけて繰り返す。
- 境界要素は無視する。
- (しらいし たろう→しらい たろう)
- 別の例:しらい たろう→しらいし たろう
- 異なる語でも同じ仮名表記になる場合があるが、その場合の順序について普及した規則はない。
コンピュータでの五十音順
文字コード
仮名文字を含む符号化文字集合は、基本的に仮名文字は五十音順になっているが、細部は異なる。
- JIS X 0208
- 清音の直後に濁音、その直後に半濁音が連続している(は→ば→ぱ→ひ)。小仮名は、通常の順序と異なり、通常の仮名の直前にある(ぁ→あ→ぃ)。例外的に、「ヴ」「ヵ」「ヶ」は「ン」の後にある。
- Unicode
- JIS X 0208 と同じ並びだが、「ヶ」の後に「ヷ」「ヸ」「ヹ」「ヺ」が追加されている。
- JIS X 0213
- JIS X 0208 と同じ並びだが、「ヶ」の後に「カ゚~コ゚」「セ゚」「ツ゚」「ト゚」が追加されている。
- JIS X 0201(テンプレート:Weight
- 「ヲ」「ァ~ォ」「ャ~ョ」「ッ」「ア~ワ」「ン」の順。五十音の中で「ヲ」だけが五十音順でない。
ソートの実装
テンプレート:See also 五十音順を実現するには、漢字等を仮名文字へ変換する必要があるため、辞書式順序 (lexicographical order) とはならず、コンピュータでデータを扱う場合の五十音順の実装には(アルファベット順に比べて)大きな手間がかかる。