データ・サイエンス・スターターキット。オライリーが薦める8冊。

プログラミングやビジュアライゼーション関連の勉強でいつもお世話になっているオライリー書籍。
オライリーの海外サイトでこんなコーナー「Data Science Starter Kit – The Tools You Need to Get Started with Data」を見つけました。

データ・サイエンティスト おすすめ 本

「ビッグデータ」にはじまり、「データ・サイエンティスト」「データ・ジャーナリズム」「オープンデータ」など、「データ」と名がつくワードが飛び交っています。

インフォグラフィックやデータ・ビジュアライゼーションも同じ「データ」文脈の線上にいて、データ解析や統計についても今後、学んでいきたいと思っています。
ただ、「データ」ワードはバズワード化しているため、客寄せ的に使われている場合も多いような気がして、どこを核に学んでいくか悩むところ。

でもオライリーがこのようにまとめてくれていると、道筋が見えてきました。

以下の8冊がスターターキットとして挙げられています(邦訳が出ているものは邦訳を挙げました)。

1.Python for Data Analysis

Pythonを使ったデータ解析が学べる本。

2.入門機械学習(Machine Learning for Hackers)

大規模なデータ処理に適した機械学習について学べる本。

3.Rクックブック(R Cookbook)

統計解析ツール「R」の使い方や機能が学べる実践的テクニック集。

4.R in a Nutshell

統計解析ツール「R」の基礎が学べる本。

5.Bad Data Handbook

悪いデータとはどんなデータかが学べる本。

6.Data Analysis with Open Source Tools

オープンソースのデータ解析ツールについて学べる本。

7.MapReduce Design Patterns

分散処理のフレームワーク「MapReduce」(Wikipedia参照)のデザイン・パターンが学べる本。

8.Interactive Data Visualization

Webベースのインタラクティブなデータ・ビジュアライゼーションが学べる本。

特に読んでみたいと思ったのは、「R」関連の本と「Bad Data Handbook」(「Interactive Data Visualization」は購入済、未読)。

挙がっていないですが、「Head First」シリーズ(認知科学、教育心理学に基づいた、効率よく、確実に身につけられるように工夫されたシリーズ)のつぎの2冊も良いかと。

Head First データ解析 – 頭とからだで覚えるデータ解析の基本

Head First Statistics – 頭とからだで覚える統計の基本

「データ・サイエンス・スターターキット」(8冊)はオライリー海外サイトからまとめ買いすると、全部で$99.99になってだいぶお得(60%OFF)。