データの関連性の発見が大切なテキストマイニング

テキストマイニングでは抽出した単語の分析の前に、単語の関連性を調査することも大切です。バスケット分析と呼ばれる、データマイニングの手法にならって関連性を見出す手法が多く用いられています。バスケット分析とは、同じカゴに物を入れるパターンを分析するもので、関連付けて使用される頻度の高い単語を分析するものです。主語と述語の係り受けなども関連性があると定義付けて、関連性を見出すことが出来ます。