言葉遊びに書いてみた
更新です。
今回の話題はこれ↓
「テキストマイニングで遊ぶ」
はい。
今回は、柄にもなくテクニカルなお話をひとつ。
テキストマイニングってご存知でしょうか?
wikipediaで調べるとこんな説明があります。
テキストマイニング(text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。
この手のソフトは、月額10万円以上する高額なものなのですが、簡易版なら無料で使えるものがあります。
それがこちら。
textmining.userlocal.jp
これを知って、 「もしかしたら、これ使うとブログで面白いことができるかも!」と思ったのですが、まだ楽しい遊び方が思いつきません 笑
適当にいじくりがてらご紹介します。
うまい使い方が見つかればみなさんのブログのネタにも使えるかもしれませんしね。
使い方は簡単。
リンクに飛ぶと、テキストボックスがあるので、そこに分析したい文章を貼り付けて「テキストマイニングする」ボタンをクリックするだけ。
ちょっと使ってみましょう。
たとえば、こんなアンケートを分析してみましょう。
コーヒーに関する調査 | サグーリサーチ自主調査
質問内容は、「コーヒーの飲み方はどのタイプですか?」。
ブラック派の回答のみ分析すると・・・
名詞 | 動詞 | 形容詞 |
---|---|---|
女性 (29) | 飲む (19) | 甘い (11) |
ブラック (28) | 入れる (11) | 良い (3) |
既婚 (27) | 楽しむ (4) | 美味しい (2) |
コーヒー (27) | 楽しめる (3) | 苦い (2) |
独身 (19) | 分かる (3) | 悪い (2) |
カッコの中の数字は出現回数です。
ということで、「コーヒーはブラック派」と答えた人は、女性、既婚者が多いみたいですね。
で、この結果から典型的な回答例は「甘いものを入れるよりブラックで飲む方が良い」みたいな感じでしょうかね?笑
一方で、砂糖とミルクを両方入れる派の回答のみを分析すると・・・
名詞 | 動詞 | 形容詞 |
---|---|---|
女性 (21) | 飲む (7) | 苦い (9) |
既婚 (14) | 飲める (6) | 甘い (6) |
独身 (12) | 入れる (4) | おいしい (2) |
ブラック (9) | 感じる (2) | 多い (2) |
ミルク (9) | 作る (1) | 小さい (1) |
ということで、こちらも回答者は、女性、既婚者が多いみたい。
で、典型的な回答例は「ブラックで飲むと苦いけど、甘いとまだ飲める」かな?
面白いのは、ブラックで飲む人の回答には「苦い」より「甘い」という言葉がよく出てくるし、砂糖とミルクを入れる人の回答には「甘い」より「苦い」という言葉がよく出てくる、ということ。
母数が少ないので断定的なことは言えませんけど、これはこういう質問では、「逆は嫌だからこっちを選ぶ」という口調を使いがちなんでしょうかね?
他にも、過去の自分のブログを分析して、どういう言葉を多用したのか、変遷を辿ってみたりするのも面白いかな、と思っています。
色々と遊べそうなツールなので皆さんも遊んでみてください!