ベクトル空間モデルのソースを表示
←
ベクトル空間モデル
移動先:
案内
、
検索
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
要求した操作を行うことは許可されていません。
このページのソースの閲覧やコピーができます。
'''ベクトル空間モデル'''とは[[情報検索]]を行うための[[アルゴリズム]]の一つ。ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量を[[三角関数|コサイン]]、[[内積]]、[[距離]]等によって計算して関連度を求める。 ==メタデータ生成法== === 単語文書行列 === 単語文書行列とはメタデータの生成・表現法の一つであり、[[ベクトル空間モデル]]による検索を行う際に非常に頻繁に用いられるメタデータの形式である。一般に単語文書行列は以下に示す構造を持つ。 単語文書行列: <math> \mathcal{M} = \begin{pmatrix} & d_1 & d_2 & d_3\\ t_1 & 0 & 2 & 1\\ t_2 & 1 & 1 & 2\\ t_3 & 0 & 0 & 3\\ \end{pmatrix} </math> 文書''d<sub>i</sub>''に単語''t<sub>j</sub>''が''n''回出現するとき、''w<sup>i</sup><sub>j</sub>''を''n''とし、行列を形成する。単純に出現回数を利用する以外に[[tf-idf]]等のアルゴリズムによって得た重みを用いる生成方法がしばしば行われる。tf-idfは下に示すように定義される。 tf-idf: {| |- |<math>\mathit{tfidf}^{d}_{t} = </math> |<math>\mathit{tf}^d_t\cdot \log\frac{N}{\mathit{df}_t} + 1</math> |- |<math>\mathit{tf}^d_t :</math> | |- |<math>\mathit{df}_t : </math> | |- |<math>N:</math> | |} {{DEFAULTSORT:へくとるくうかんもてる}} [[Category:アルゴリズム|へくとるくうかん]] [[Category:検索|へくとるくうかん]] [[Category:数学に関する記事]]
ベクトル空間モデル
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
新しいページ
最近の更新
おまかせ表示
sandbox
commonsupload
ヘルプ
ヘルプ
井戸端
notice
bugreportspage
sitesupport
ウィキペディアに関するお問い合わせ
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報