テキストマイニングサービス
テキストマイニングをソフトウェアに頼らずリサーチ会社などに依頼する場合は、利用料金とサービス内容についてのバランスをチェックします。また、分析機能だけではなく、テキストマイニングの前段階である「テキストの洗浄」について、新しい言葉や言い回しにどの程度対応できているかも確認しておきましょう。自社のニーズとどこまでマッチした分析を行うことが出来るかどうかに視点を置いて依頼先を選びましょう。
トラックバックURL:
テキストマイニングをソフトウェアに頼らずリサーチ会社などに依頼する場合は、利用料金とサービス内容についてのバランスをチェックします。また、分析機能だけではなく、テキストマイニングの前段階である「テキストの洗浄」について、新しい言葉や言い回しにどの程度対応できているかも確認しておきましょう。自社のニーズとどこまでマッチした分析を行うことが出来るかどうかに視点を置いて依頼先を選びましょう。
トラックバックURL:
テキストマイニングのソフトを選ぶ時には、まず機能を確認します。一般的な分析機能はもちろんのこと、自社の分析方針に沿った内容であるかを確認しなければいけません。カスタマイズが可能であればそちらを選ぶようにします。アンケートの内容が多岐に渡る場合などは、カスタマイズ可能なソフトの方が拡張性が高く、長く利用できるからです。各社特徴のあるソフトを発売していますので、じっくりと比較して選ぶことが大切です。
トラックバックURL:
テキストマイニングのソフトウェアには無償の商品と有償の商品があります。無償のソフトウェアでは分析機能が限定されている場合が多いため、初めてテキストマイニングを行う練習段階という場合に利用すると良いかも知れません。有償のソフトウェアでも、金額によっては分析機能に差がありますので、テキストマイニングの分析機能で求めたい結果が得られるかどうかをしっかりと確認して購入する必要があります。
トラックバックURL:
では、実際にテキストマイニングを取り入れる場合は何から始めたらよいのでしょうか?分析について数学的な知識を身につけて自分で始めることも良い方法ですが、手軽にスタートできるサービスを利用するのも一つの方法です。現在、リサーチを専門に取り扱う会社によって、テキストマイニングのサービスを受けることが出来るようになっています。市販のソフトウェアにもテキストマイニングに関する商品が多く発売されています。
トラックバックURL:
テキストマイニングではマッピングと呼ばれるビジュアルで単語の分析を行う手法が用いられています。単語の出現頻度のデータやコレスポンデンス分析で求められた関連性を2次元で表し、ビジュアル的に分かりやすく表現する手法です。点在するデータのポイントが近いほど関連性が深く、テキスト分析の結果を誰が見ても分かりやすく表現することが出来るため、テキストマイニングでは欠かせない分析・表現手法になっています。
トラックバックURL:
コレスポンデンス分析はテキストマイニングにおいては一般的に用いられている分析手法です。多変量解析の一種でテキストの出現頻度を数値化した結果を元に複数の分類項目の類似性や関係の深さを調べる場合に用います。例えば、「夫」というキーワードを使う回答者は30代以上の女性が多く、「夢」というキーワードを使う回答者は20代~30代の男性が多い。このように回答者の属性とキーワードの関連性を求めることが出来ます。
トラックバックURL:
テキストマイニングでは抽出した単語の分析の前に、単語の関連性を調査することも大切です。バスケット分析と呼ばれる、データマイニングの手法にならって関連性を見出す手法が多く用いられています。バスケット分析とは、同じカゴに物を入れるパターンを分析するもので、関連付けて使用される頻度の高い単語を分析するものです。主語と述語の係り受けなども関連性があると定義付けて、関連性を見出すことが出来ます。
トラックバックURL:
テキストマイニングに入る前にテキストの洗浄を前準備として行います。精度の高い抽出(洗浄)を行ったテキストは非常に信頼性が高いので、これらをまず数値化して分類します。テキストの数値化とは、出現頻度を数値で表すもので、出現頻度をカウントしグラフなどのツールを使ってビジュアル化します。質問内容が簡易な場合、頻度の高いテキストについてはこのグラフだけでもある程度の法則を見出すことが出来ます。
トラックバックURL:
テキストマイニングにおいては、曖昧な感情表現も顧客のニーズを知るための重要な要素です。商品の良くない点について「悪い」とはっきりと書いてあれば良いのですが、日本語では「あまり好きではない」「気に入らない」など曖昧な表現も多く用いられます。これらを置き換えるときに、「悪い」なのか「まあまあ良い」なのかで結果は大きく変わってきます。実際の分析ではこのような感情表現にも細かい注意を払う必要があるのです。
トラックバックURL:
テキストマイニングの難しい点は、テキストの洗浄にあるといわれています。特に様々な表現を用いる日本語では洗浄に厳しいルールを設けなければ、単語の抽出が非常に難しくなるからです。例えば、「妻」という単語。英語では「Wife」と簡潔ですが、日本語では「女房・相方・奥さん・・・」というように様々な表現方法があります。これらを統一させるルールを設けた洗浄方法でなければ、精度の高い抽出は実現できません。
トラックバックURL: