« ハリー・ポッターと謎のプリンス 下 | トップページ | 青いうた »

2006.05.23

数式を使わないデータマイニング

岡嶋裕史著、『数式を使わないデータマイニング入門 -- 隠れた法則を発見する』、光文社新書、2006年を読む。

本書は、データマイニングの概念を非常に簡単に紹介したもの。 本書で取り上げているのは、データマイニングとは何か、そのために集めるべき/集められる情報、得られる知見、回帰分析、決定木、クラスタ分析、自己組織化マップ、連関規則(因果関係の分析)、ニューラルネット、個人情報などの収集と管理の問題、Web2.0時代の監視問題など。 挙げられている例も具体的でわかりやすい。

本書の特徴は、データマイニングをするときに、どういうことがうまくいかないのかという、限界も紹介しているところだ。 入門書というのは「これを使うとこんなにうまくいく」という紹介になりがちだが、本書では本質的なアイデアを紹介し、その限界をわかりやすく提示している。

なお、紹介されている内容は、本質的で原理的で初歩的なものだ。 これを読んだからと言って、データマイニングのツールが使えたり、できるようになるわけではない。 ただし、高度なツールや情報社会の背後で動いている原理は、なんとなく見えてくるかもしれない。

|

« ハリー・ポッターと謎のプリンス 下 | トップページ | 青いうた »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/11321/10210370

この記事へのトラックバック一覧です: 数式を使わないデータマイニング:

« ハリー・ポッターと謎のプリンス 下 | トップページ | 青いうた »