ビッグデータ・ブームの中で、21世紀で最もステキな仕事と持ち上げられているデータサイエンティスト。そのデータ分析の仕事の中身を具体的に説明する本が『会社を変える分析の力』である。著者は大阪ガスで、10年かけて独立採算のデータ分析の部署を立ち上げた。その経験に基づき、データ分析の仕事、データサイエンティストの姿を丁寧に解説する。データ分析のプロフェッショナルとしての心構え・スキル・リテラシーをわかり易く記した良書だと思う。
- 作者: 河本薫
- 出版社/メーカー: 講談社
- 発売日: 2013/07/18
- メディア: 新書
- この商品を含むブログ (13件) を見る
データ分析者に求められるスキルといえば、統計学に基づく数値処理とか、ITを使った大規模なデータ処理が真っ先に挙げられるが、これだけでは価値のあるデータ分析はできないと著者は言う。本書の中で再三強調されているのは、ビジネスのやり方を変えたり、企業の意思決定に使われたりしない限り、データ分析には意味がないということだ。「データ分析 = データから経営課題・問題を解明するプロセス」ととらえ、その価値は「意思決定への寄与度」と「意思決定の重要性」の掛け算で決まるとする。いくら高精度に解析しようが、モデルを緻密にしようが、意思決定を通して実際のビジネスに効用を生み出さなければ価値はない。そのためには、分析結果の導入についての「費用対効果の壁」と KKD(勘と経験と度胸)に基づく従来のやり方からみた「心理的な壁」を乗り越えなければならない。
流行りのビッグデータも、データ分析の一種と位置づけている。ビッグデータ偏重のあまり、データは大量でなければいけないという偏見が弊害を生んでいると指摘する。中小規模のデータ、リトルデータからも貴重な分析結果は得られるし、企業内にはそうしたリトルデータがまだまだ宝の山として眠っていると、昨今のビッグデータ偏重について、警鐘を鳴らしている。
下記の『ビッグデータの正体』に書かれているように、ビッグデータの本質は「部分計測から全数計測(from some to all)」であり、それによりデータ分析の方向性が「因果関係の探求」から「相関関係の探求」へ変わる。予測や判別の精度や分解能が向上するが、その根拠・因果関係はわからないことに注意する必要がある。ビッグデータ分析がなかなかうまくいかない理由として、必要なデータが必ずしも揃っていない、説明責任を果たせない、明確な目標なしに始めても情報過多の世界を彷徨うだけ、といった状況を指摘する。
この本ではよいデータ分析者になるための力・流儀については、以下のような観点からまとめられている。まずデータ分析でビジネスを変革するには、次の3つの力が必要であるとする:
- 問題発見力:ビジネス課題を見つける力
- ビジネスシーンで分析を活用できる機会をひらめく
- ビジネス側からの発想
- データ分析が役立つかを目利きする
- 分析力:解く力
- 意思決定に役立つ問題設定
- 現場力・現場の知恵
- 過不足なく解く
- 分析ミスをしない(ミスは損失に直結)
- 実行力:意思決定に使わせる力
- 意思決定に使えるかを見極める:「どれぐらい外れそうか」「外れても許容できるか」
- 使い方を伝える:効果を明確に伝える
データ分析者が常に自問自答すべき四つの問い:
- その数字にどこまで責任を取れるか?
- その数字から何がわかったか?
- 意思決定にどのように使えるのか?
- ビジネスにどのくらい役に立ったか?
そしてデータ分析者の心構え:
- 「意思決定を支援する」という正しい動機を持つ
- 見つかったパターンに対して、本当に正しいか、懐疑的になろう
- KKD には根拠がないが、現場のノウハウがある。KKD に対して敬意を持ち、データ分析について謙虚になろう
実際にデータ分析を行うにあたり、データ分析問題だけではなく意思決定問題であることに関心を持つこと、意思決定問題を注意深く吟味し、場合によっては、データ分析結果から意思決定問題を見直す可能性も示唆している。
データ分析者の身につけるべきよい習慣として、たとえば
- ビジネスの現場に出よう、ビジネス担当者とコミュニケーションしよう
- 整理整頓を心がけよう
- 「なぜ?」を追求しよう
- データをビジュアル化しよう
このように、長年にわたる地道なデータ分析の実践経験から、データ分析のあるべき姿、よいデータ分析者になるための心構えや習慣が平易にまとめられている。それは、「データ分析者」を「研究者」「技術者」「SE」に置き換えてもあてはまることだと思う。
関連する本:『ビッグデータの正体』
『会社を変える分析の力』の著者が、ビッグデータの本質が何か?という疑問に悩んでいた時に、この原著に出合って疑問が解消されたという本が、『ビッグデータの正体』である。
- 作者: ビクター・マイヤー=ショーンベルガー,ケネス・クキエ,斎藤栄一郎
- 出版社/メーカー: 講談社
- 発売日: 2013/05/21
- メディア: 単行本
- この商品を含むブログ (24件) を見る
ビッグデータ本が多数出版される中で、ビジネス、生活、社会に対する影響や、ビッグデータならではの変革、そしてリスクを見事な語り口で活写しており、must read の一冊。インフルエンザの流行を、医院からの情報ではなく、Google の45の検索キーワードとの相関でリアルタイムにわかるという導入事例から面白い。
ビッグデータを「小規模ではなしえないことを大きな規模で実行し、新たな知の抽出や価値の創出によって、市場、組織、さらには市民と政府の関係などを変えること。」(Big data refers to things one can do at a large scale that cannot do at a smaller one, to extract new insights or create new forms of value, in ways that change markets, organizations, the relationship between citizens and governments, and more.)と捉える。
そしてビッグデータのもたらす変化を三つの切り口から整理して、豊富な実例を紹介する。
- ビッグデータは限りなくすべてのデータを扱う。 統計のサンプリングの制約が取り除かれることを指している。
- 量さえあれば精度は重要ではない。
- 因果関係ではなく相関関係が重要になる。