SPSS Statistics

テキストマイニングの実践とソフトウェア

記事をシェアする:

内田 治 氏

テキストマイニングとは、文章の形式で得られているデータ(文章データ、言語データ、テキストデータといった呼び方をする)から、有効な情報をコン ピュータの力を使って抽出する方法のことです。この方法は決して新しい方法ではなく、10年ほど前から盛んに提唱されているものですが、普及は十分にして おりませんでした。この理由はテキストデータが入手しにくいということ、入手できてもソフトに入力するのが面倒であるということ、専用ソフトが高価である ことにあったと考えられます。

ところが、ネット調査の普及により、アンケート調査における自由回答文の収集が容易になったこと、以前に比べて安価で良質なソフトウェアが登場したことにより、再びテキストマイニングの効用に注目が集まり、質的研究の分野でかなり使われるようになってきました。

そこで、筆者のひとりである内田は、テキストマイニングと統計解析に着目した書籍を企画し、このたび、「SPSSによるテキストマイニング」という書籍を発刊することになりました。

テキストマイニングは、文章を単語に分割してカテゴリ化する部分と、カテゴリ化したデータを統計的に分析する部分に分けることができます。したがっ て、テキストマイニングを実施するには、文章を単語に分けるため自然言語解析を実行するソフトと、統計解析を実施するためのソフトが必要になります。

この書籍「SPSSによるテキストマイニング」では、文書を単語に分けるためのソフトとして、SPSS Text Analysis for Surveysを、統計解析のためのソフトとして、SPSS Statisticsを取り上げています。そして、テキストマイニングの基本的な考え方と、テキストマイニングのソフトであるSPSS Text Analysis for Surveysの利用方法を解説することが、この書籍の主たる目的で、次の3つのパートで構成しています。

第1部 テキスト分析
第2部 SPSS Text Analytics for Surveysの操作
第3部 統計解析

なお、この書籍で取り上げているSPSS Text Analytics for Surveysのバージョンは4、統計解析に使用したSPSS Statisticsのバージョンは20です。

筆者紹介
uchida
内田 治氏

SPSS関連書籍のご案内

thumb_book20120601_70x70
[著者] 内田 治 川嶋 敦子 磯崎 幸子 共著 [出版社] オーム社 [初版] 2012年6月 [価格] 3,360円(税込み)

SPSSによるテキストマイニング入門

More SPSS Statistics stories

AI & データ関連Webセミナーのご案内

IBM Data and AI, IBM Watson Blog, アナリティクス...

自席からご参加いただけるWebセミナーです!開催当日は、チャットでQ&Aも行えます。開催翌日からは、録 ...続きを読む


IBMがDataOpsとWatson Anywhereを進化させる新機能を発表

アナリティクス

競争優位性の獲得とビジネス・パフォーマンスの向上に関して言えば、データは企業の最も貴重な資源ですが、時間も極め ...続きを読む


【7月24日開催】AIが革新する営業 &マーケティング – 「誰もがデータ活用」で業務はどう変わるのか

アナリティクス, イベント・セミナー

デジタル化の進展に伴い様々なデータが収集できるようになり、それを業務変革に生かしたいというニーズが高まっていま ...続きを読む