数式を使わないデータマイニング
岡嶋裕史著、『数式を使わないデータマイニング入門 -- 隠れた法則を発見する』、光文社新書、2006年を読む。
本書は、データマイニングの概念を非常に簡単に紹介したもの。 本書で取り上げているのは、データマイニングとは何か、そのために集めるべき/集められる情報、得られる知見、回帰分析、決定木、クラスタ分析、自己組織化マップ、連関規則(因果関係の分析)、ニューラルネット、個人情報などの収集と管理の問題、Web2.0時代の監視問題など。 挙げられている例も具体的でわかりやすい。
本書の特徴は、データマイニングをするときに、どういうことがうまくいかないのかという、限界も紹介しているところだ。 入門書というのは「これを使うとこんなにうまくいく」という紹介になりがちだが、本書では本質的なアイデアを紹介し、その限界をわかりやすく提示している。
なお、紹介されている内容は、本質的で原理的で初歩的なものだ。 これを読んだからと言って、データマイニングのツールが使えたり、できるようになるわけではない。 ただし、高度なツールや情報社会の背後で動いている原理は、なんとなく見えてくるかもしれない。
| 固定リンク
この記事へのコメントは終了しました。
コメント