日本語入力システム
日本語入力システムはインプットメソッドのうち、特にパソコンやワープロ、携帯電話などに日本語を入力するためのものを指す。通常はキー入力をソフトウェアで制御して実現する。
目次
概要
パソコンにおいて、英文の入力は一般のキーボードでタイプライター同様にタイプすれば入力可能であるが、日本語のように使用文字数が数千を超える言語の文章を入力する際には全ての文字に一つのキーを当てはめるキーボードは非現実的であるため、複数のキーの操作で一文字を入力するなどの仕組みが必要となる。
日本語入力システムは、MS-DOS時代はもっぱらフロントエンドプロセッサとして実装されたため、日本語入力フロントエンドプロセッサ(日本語入力FEP、さらに略してFEP)などと呼ばれることが多かった。Windowsの普及後はインプット メソッド エディタ(IME)と呼ばれることが多くなった。
ワープロ・パソコンだけでなく、携帯電話やビデオレコーダー・ゲーム機といったデジタル家電など日本語の入力を必要とする様々な機器に日本語入力システムが組み込まれている。
入力方法
日本語の入力方法で現在主流なのは、読みとしてかなを何らかの形で入力しておいて、漢字・かな・英字などの変換候補から選択して入力するかな漢字変換である。これは、1978年9月26日に、東芝の「JW-10」の発売によって実現された。
その他、漢字直接入力などの方式が存在する。また、補助的に、単漢字変換やコード入力、手書き入力、入力予測、音声認識なども用いられる。
かなの入力方法としては、パソコンではJIS配列のキーボードによるかな入力と、QWERTY配列のキーボードによるローマ字入力が主流である。これらを含む様々な入力方式の詳細については、キー配列を参照のこと。
携帯電話ではトグル打ち、スマートフォンではトグル打ちに加えてフリック入力が一般的。
主な機能
入力・変換
ユーザーはひらがなである程度まとまった文章を入力し(未変換文字列)、変換キーを押すとIMEが文節の区切りを判別して文節ごとに漢字変換を行う。慣用句など複数文節にわたる用例のデータベースを持ち、前後の文節を参照して適切な変換がなされる。一部のIMEには未変換文字列が溜まると自動的に逐次変換したり、句読点の入力で変換を行う機能がある。
変換された結果が適切な場合は、確定キーを押して変換後の文字列がアプリケーションに渡される。意図しない変換結果になった場合、ユーザーが文節ごとに適切な変換候補を選んだり、文節の区切りを修正したりできる。そういった作業をせずに「一発変換」できるのが理想的であり、変換精度の優劣はIMEの性能において決定的な要素の一つになっている。
辞書
各IMEはかな漢字変換用の語彙データベース(システム辞書)を内蔵している。それに加えて記号/特殊文字・英単語・顔文字・方言・インターネットスラングなど様々な語彙に対応したり、郵便番号と地名の相互変換・翻訳・計算など、変換システムを利用した便利な機能を持つ場合がある。
ユーザーが好みの単語・用例を登録できるユーザー辞書機能がある。学習機能が優れていたり、IMEが用意する辞書そのものが充実していれば登録作業は少なくて済む。また特定の不要な変換候補が頻繁に表示されて困るような場合、その語句が変換結果に現れないように登録する「抑制単語」という仕組みもある。
学習
ユーザーの変換・確定結果を記憶し変換精度を上げる仕組み。学習が蓄積されることにより、IMEは自動的に各ユーザー個人に最適化されていく。誤った変換結果も保存されるため誤りが次回以降に再現されるのが難点で、ATOKなどでは変換履歴を直接編集して不要な学習のみを削除することができる。
学習が多く蓄積されると逆に変換精度が落ちたと感じたり、学習機能に異常をきたす場合がある(Microsoft IMEの項などを参照)。その場合は学習結果をリセットして初期状態に戻すなどの作業が求められる。
入力支援機能
かな入力の量を減らすことができる入力予測は、キーボードに比べて入力が遅い携帯電話向けに発展した。その後(2000年代後半)、ATOKやGoogle 日本語入力などパソコン向けIMEにも取り入れられたが、Google 日本語入力の場合はGoogle検索のシステムを流用したものであるなど、携帯電話のそれとは仕組みが異なる場合もある。
紛らわしい同音異義語をユーザーが正しく選択するのを支援するため、一部のIMEには同音異義語の意味・用法を解説するサブウィンドウを表示する機能がある。
素早いタイピングができるユーザーは、予測候補をいちいち選択するなどの作業で入力速度が逆に落ちたり、支援機能がうっとうしく感じさせるだけになる場合もある。またサブウィンドウの表示などでレスポンス(反応時間・体感速度)が損なわれることもある。このため設定で個別の付加機能を無効化できるのが普通であるテンプレート:要出典。
パーソナルコンピュータ、ワープロ専用機向け
名称 | 開発元 | 備考 |
---|---|---|
Anthy | オープンソース | 基本的に漢字変換のみを扱う。入力そのものはuimや、付属のanthy.elなどを通じて行う |
ATOK | ジャストシステム | |
Baidu IME | バイドゥ | フリーウェア |
Canna | オープンソース | 元々はNECが開発していたが、後にオープンソース化。漢字変換のみ |
EGBRIDGE | エルゴソフト | |
FIXER | シティソフト | |
FSKAREN | 富士ソフト | |
Google 日本語入力 | フリーウェア。オープンソース版はMozcという。 | |
Microsoft IME | マイクロソフト | 日本語用以外のものもある |
Japanist,OAK | 富士通 | |
Katana | サムシンググッド | 初期は大塚商会が開発していた |
NECAI | NEC | PC-9800シリーズ用 |
PRIME | オープンソース | 漢字変換のみ |
sj3 | オープンソース | 元々はソニーが開発していたが、後にオープンソース化。漢字変換のみ |
SKK | SKK Openlab | |
Social IME | 奥野陽 | ユーザーが単語を登録することで自律的に成長していくシステムを採用している |
T-Code | オープンソース | |
Tegaki | オープンソース | |
TUT-Code | 大岩 元,高嶋孝明 | |
VJE | バックス | |
Wnn | オムロン | |
WXG | エー・アイ・ソフト | |
甲賀忍者 | 岩本電気 | 漢字ROMボード |
松茸 | 管理工学研究所 | |
ことえり | Apple | |
書院IME | シャープ | Power書院というワードプロセッサーも存在する |
風 | 演算星組 | 現在はシェアウェア |
かわせみ | 物書堂 |
組み込み機器、携帯電話向け
- ATOKシリーズ(+ATOK、ATOK Pad 等)(ジャストシステム)
- Wnnシリーズ(iWnn・Advanced Wnnなど)(オムロン。ワークステーション向けソフトに由来)
- POBox(ソニー。単体では予測変換システムで、ソニーエリクソンの端末ではWnnシリーズとの組み合わせで搭載)
- Mogic Engine(NEC)
- FSKAREN(富士ソフト。シャープの「ケータイShoin」も基幹部分はほぼ共通)
- Mobile Rupo(東芝。同社製のワープロ「Rupo」搭載の変換ソフトに由来)
- Google 日本語入力(Android用)
- Compact-VJE(バックス)
- +J for S60(管理工学研究所)
- Mazec(MetaMoJi)
その他
- 日本のインターネットスラングの中には、IMEの誤変換から生まれて定着したものが数多くある。
外部リンク
- 日本語入力プログラムについて考える
- Ajax IME: Web-based Japanese Input Method - 海外などで日本語入力ができる。
- InputKingオンライン入力システム - 日本語入力に加えて、中国語や韓国語、欧米諸言語とインド諸語、ベトナム語にも対応。