みなさんこんにちは。
PITの松原です。
今日は無償で利用できるテキストマイニングツールのご紹介です。
それではテキストマイニングって何?という部分からご説明します。
■テキストマイニングって何
テキストマイニングとはテキスト(文章)の中で使われている単語や単語間の関係、関係の強さなどを分析することです。
データマイニングと呼ばれるデータベースにきちんと整理されて格納されているデータの分析と違い、単語を認識したり不要な語を省いたりなど分析を処理するプロセスが複雑になることから 高度な技術を要すると言われてきました。
■どうやってやるの?
昨今ビッグデータと呼ばれる企業内で持っているあらゆるデータを活用しようとする流れでテキストマイニングも注目を集めています。 テキストマイニングは分析用のツールを利用しますが、先ほども書いたように分析処理が複雑なため、有料の高価なツールが主流となっています。例えば
・Text Mining Studio NTTData数理システム 約250万円~
・TRUE TELLER 野村総合研究所 約600万円~
・Content Analytics with Enterprise Search IBM 約2000万円~
等が挙げられますが、これらのツールは高価で操作を理解するのも専門知識が必要で中小企業や個人事業主には敷居の高いものでした。
しかし、中には高度な処理が行えるにも関わらず、比較的操作も容易、かつ無償で利用できるソフトもあります。
それが今回ご紹介すするKH Coderです。
■KH Coderとは
KH Coderとは立命館大学の樋口耕一教授が開発したテキストマイニングツールです。
公式サイト
http://khc.sourceforge.net/
KH Coderで出来る事
・出現頻度の高い語のチェック
・語と語の結びつきを調べる
・テキストの部分ごとの特徴を調べる
等々です。
■KH Coderの活かし方
今回は、とある喫茶店で売上拡大にクチコミを分析するという事例で考えながらビジネスへの活用方法をご紹介します。
なお、ツールの使い方は公式サイトあるチュートリアルを参考にして頂き、今回の紹介では割愛させて頂きます。
1) データの収集を行います。
最初に行うのは、対象となるテキストデータを集める事です。Twitterや食べログなどに書き込まれたコメント、来店して頂いたお客様に記入してもらったアンケートなどを収集し、分析の元となるテキストを収集します。
2) 頻度表を作成します。
アンケートや口コミなどを分析し、頻度表を作成します。これは出現頻度の高い語を順番に表わしたものです。
この喫茶店の店長は店内の雰囲気の良さや厳選したコーヒー豆を使ったコーヒーが売りだと思っていましたが、頻度表を作ってみたら「ケーキ」、「スィーツ」といった語が上位に来ることがわかりました。
3) 語と語の結びつきを探ります。
ここでは更に語と語の結びつきを探ります。先ほどケーキ、スィーツという語の出現頻度が高いとわかりましたが、それらの語と一緒に使われる語の関係を調べることが出来ます。「ケーキ」には「美味しい」、「可愛い」、「めちゃウマ」など肯定的な語との強い関連があることがわかりました。
4) 分析結果を実際のビジネスに活かします。
その他にもKH Coderで分析出来る事は多数ありますが、頻度表と語の関連を分析するだけでも多くのヒントを得ることが出来ます。分析で得たヒントをビジネスに活かしていくことが重要です。
今回の例に挙げた喫茶店では店長が思っているお店の雰囲気やこだわりのコーヒーといったお店の特徴より、お客様はケーキ類に好意をもっていることがわかりましたので、ケーキ類の販売を増やすため、自家製ケーキのこだわりをアピールする宣伝手法を取り入れる等のこれまでと違ったマーケティング戦略を立てることが出来るようになります。
■まとめ
KH Coderは無償のテキストマイニングツールですが、機能も豊富に取り揃えられており、テキストデータを分析し、ビジネスに活用したい時には最適なツールです。
まずはKH Coderを使って身近にあるアンケート結果の分析を始めてはいかがですか?