シソーラス
出典: フリー百科事典『ウィキペディア(Wikipedia)』
シソーラス (Thesaurus) とは、単語の上位 / 下位関係、部分 / 全体関係、同義関係、類義関係などによって単語を分類し、体系づけた辞書。
概要
語源はギリシャ語"thesauros"で、宝物庫の意味。1852年、英国でロジェ (en:Peter Mark Roget 1779-1869) が、語彙を意味によって分類した『Thesaurus of English Words and Phrases』(英語語句宝典、1852)を著したのが始まりとされる。日本では1964年、国立国語研究所編の『分類語彙表』が発表されている。
シソーラスは類語辞典の一種といえるが、一般的な類語辞典は五十音順に項目立てがされているのに対し、シソーラスは語彙の持つ意味から、大分類 - 中分類と下っていき、目的の単語に達することができるようになっている。
シソーラスは自然言語処理の分野でも重要な位置にあり、『分類語彙表』や『EDR概念体系辞書』のように電子データベース化されているものもある。データベース化されたシソーラスは木構造、または表形式で成り立っているものが多く、全文検索システムなどで利用される「あいまい検索」も表記ゆれ以外のものは、シソーラスを利用して行われている。
代表的なシソーラス
日本語のもの
- 『分類語彙表』(国立国語研究所)
- 『日本語語彙大系』(岩波書店)
- 『角川類語国語辞典』(角川書店)
- 『日本語大シソーラス』(大修館書店)
- 『EDR概念体系辞書』(EDRプロジェクト)
- 『デジタル類語辞典』(ジャングル)
- 『JST科学技術用語シソーラス』(JST科学技術振興機構)
英語のもの
- 『ロジェ類語辞典』Roget's Thesaurus of English Words and Phrases(英語語句宝典、1852、1911) - Peter Mark Roget
- 『WordNet』電子化されたデータベース - Princeton University, USA
- 『MeSH (Medical Subject Headings)』生命科学の文献管理検索用語のデータベース