4月 252017
 

ビッグデータの正体 情報の産業革命が世界のすべてを変える
ビクター・マイヤー=ショーンベルガー(著),ケネス・クキエ(著),斎藤栄一郎(訳),講談社,2013

ビッグデータの正体

随分と前に読んだのだが,ブログにメモを残していないことに気付いたので,少し書いておくことにする.

流行の(ピークアウトしつつある)ビッグデータについて書かれた本で,書名にある通り,ビッグデータが人類社会に与える影響について書かれている.原題は「Big Data: A Revolution That Will Transform How We Live, Work, and Think」で,評判が良さそうなので読むことにした.

まず,ビッグデータとは何であるかという点について,よくある3Vsや4Vsを持ち出さずに,次のようにまとめられている.

Big data refers to things one can do at a large scale that cannot be done at a smaller one, to extract new insights or create new forms of value, in ways that change markets, organizations, the relationship between citizens and governments, and more.

日本語訳では次のように書かれている.

現時点でビッグデータの捉え方は,次のようにまとめることができる.「小規模ではなしえないことを大きな規模で実行し,新たな知の抽出や価値の創出によって,市場,組織,さらには市民と政府の関係などを変えること」.

それがビッグデータである.

ただし,これは始まりにすぎない.ビッグデータの時代には,暮らし方から世界との付き合い方まで問われることになる.特に顕著なのは,相関関係が単純になる結果,社会が因果関係を求めなくなる点だ.「結論」さえわかれば,「理由」はいらないのである.

ここで登場する「因果関係ではなく相関関係が重要になる」という考え方が本書では強調されている.例えば,ビッグデータにおける3つの大変化として,以下の項目が挙げられている.

ビッグデータは限りなくすべてのデータを扱う.

量さえあれば精度は重要ではない.

因果関係ではなく相関関係が重要になる.

「ビッグデータは限りなくすべてのデータを扱う」はVolume,Velocity,Varietyと関連し,「量さえあれば精度は重要ではない」はVolume,Veracityと関連すると考えられる.このため,従来の4Vsでのビッグデータの説明と変わりはない.ところが,もうひとつ,「因果関係ではなく相関関係が重要になる」が付け加えられている.確かに,膨大なデータから相関関係の存在が確認されたなら,それを(因果関係を確認せずに)意思決定に活用するという態度はありうる.そして,それが成功に繋がることもあるだろう.失敗が許されるのであれば,失敗したらやり直せばいいので,迅速に意思決定を行うことを重視するなら,そのような態度も納得できる.

しかし,本書「ビッグデータの正体」では,著者はさらに突っ込んだ主張を展開している.

「データによる物事の判断は,人間の判断を補完し,ときに上回ることもある」.これがビッグデータの最大の衝撃だろう.そのような形が普通になれば,統計学者やデータアナリストはともかく,それ以外の分野のエキスパートは輝きを失うはずだ.

特定分野のエキスパートが絶滅するわけではないが,権威は低下する.今後はビッグデータの専門家と競わなければならない.これまで主役を独占してきた因果関係も,これからは新参の相関関係と並んでスポットライトを浴びなければならない.

ここでいう「それ以外の分野」や「特定分野」が具体的に何であるか何でないかは必ずしも明確でないが,この主張のようにはならない分野もあるだろう.それに,統計学者やデータアナリストが別格扱いされているが,彼らの多くもいずれ人工知能(AI)で代替されるという説もある.いずれにせよ,どのような知識や技能を身に付けていくかというのは,個人レベルでよく考える必要がある.

私の立場は,対象についての専門知識(domain knowledge)とデータ解析の統合利用が成功の鍵を握るというもので,実際に研究もこの方針で実施してきた.

本書で強調されていることが他にもある.それは,データそのものの価値だ.いくつか引用しておこう.

言葉をデータ化すると,数え切れないほどの用途が生まれる.人間が読めるだけでなく,コンピュータによる分析も可能になるからだ.ビッグデータ関連企業の典型であるグーグルは,情報が多彩な目的に利用できる点を心得ている.だから,収集とデータ化に伴うコストや手間を惜しまない.

同じ目的での使い回しだけでなく,いろいろな目的に何度でも利用できる.これはビッグデータ時代の情報の価値を考えるうえで,非常に重要なポイントだ.(中略)データに秘められた本当の価値は,最初の目的に照らしたときの価値をはるかに上回る.

データの価値を考えるときには,単に現在の用途だけに着目するのではなく,将来的に利用可能な用途をすべて吟味する必要があるのだ.(中略)かつては,あるデータを本来の用途に使ったら目的を達成したものと考え,いつ捨ててもよかった.本来の価値が発揮されたように思われたからだ.ビッグデータ時代はデータがダイヤモンド鉱山になる.本来の価値を発揮した後でも,その魅力は簡単には色褪せない.

米国では1980年代半ばに上場企業全体の時価総額の40%ほどが無形固定資産だったが,2000年代の幕開けごろには4分の3を占めるまでに比重が大きくなった.無形固定資産には,ブランドや人材,戦略など,有形ではないが,得意識的に財務会計の対象となる資産がすべて含まれる.最近では企業が保有・活用しているデータも徐々に無形資産と考える傾向が強まっている.

統計学者のようなスキルばかりが注目されて,データ自体が軽視される風潮はそう長く続かない.業界の発展に伴って,バリアンが絶賛する統計学者的なスキルが一般人にも広く浸透すれば,人材不足の問題は解決する.

それに比べて,データの重要性は変わらない.データが大量にあるからといって,勝手に無料で使ってもいいわけがない.統計学者のような処理技能を持つ専門家も,斬新な利用法を思い付くアイデアマンも,時代とともに浮き沈みする可能性があるが,データ自体の重要性は変わらない.それだけデータ保有者は大切な存在なのだ.

ビッグデータの揺籃期にある現在は,アイデア型とスキル型に一番大きな価値がありそうだ.だが,最終的にはデータ型企業の価値が最大になるはずだ.その理由として,データを使ってできることがもっと増える点,ならびに,データの保有者がその潜在的な資産価値を的確に評価できるようになる点が挙げられる.その結果,データ保有者がデータを内部に囲い込む可能性が高い.外部に提供するにしても,利用料をつり上げるはずだ.金鉱のたとえで言えば,やはり金自体が一番重要なのである.

本書を含め,ビッグデータ関連の本やニュースでは,データ解析屋あるいはデータサイエンティストの重要性がこれでもかというほど強調されている.目を疑うような数字を添えて,人材不足も叫ばれている.そのような状況において思うのは,最終的に報われるのは誰か?ということだ.データサイエンティストだろうか.

かつて,The Economist誌の記事「Data, data everywhere」(2010/2/25)において,データサイエンティストは次のように紹介された.

a new kind of professional has emerged, the data scientist, who combines the skills of software programmer, statistician and storyteller/artist to extract the nuggets of gold hidden under mountains of data.

データの山に隠された金塊を掘り出すのがデータサイエンティストだというわけだが,これはつまり,データのゴールドラッシュ時代が到来したということだ.実際,多くの経営者が(理解しているかどうかは別にして),我が社もビッグデータをビジネスに活かそうとか,人工知能を活用しようとか,号令をかけている.実行部隊は道具を手にデータの山を掘るが,彼らは報われるだろうか.

1850年前後にカリフォルニアで起こったゴールドラッシュを振り返ってみよう.多くの人々がカリフォルニアを目指し,実際に金を探しまくった.そのゴールドラッシュで巨財をなしたのは誰だろうか.

例えば,リーヴァイ・ストラウス(Levi Strauss)は,一攫千金を狙う人達を見て「丈夫な作業着が必要だ」と気付き,キャンバス地で丈夫な作業ズボンを作った.リーバイスのジーンズの誕生だ.「多くの人が金を掘るなら大量の道具が必要だ」と気付いたサミュエル・ブラナン(Samuel Brannan)は,シャベルや鶴嘴,篩を売りまくった.そして,ヘンリー・ウェルズ(Henry Wells)とウィリアム・ファーゴ(William Fargo)は,採掘者が掘り当てた金を換金し,手紙や荷物の輸送,預金・送金サービスを提供した.その会社こそがウェルズ・ファーゴ銀行だ.

本書「ビッグデータの正体」にはこう書かれている.

ビッグデータというダイヤモンド鉱山でコツコツと採掘に励み,報酬を手にする.しかし,掘り出したダイヤモンドはデータの持ち主のものなのだ.

皆さんのビッグデータ時代における成功を祈ります.(自戒を込めて)

目次

 
第1章 世界を変えるビッグデータ
When Data Speaks データが語り始めるとき
 
第2章 第1の変化「すべてのデータを扱う」
「N=全部」の世界
 
第3章 第2の変化「精度は重要ではない」
量は質を凌駕する
 
第4章 第3の変化「因果から相関の世界へ」
答えが分かれば、理由は要らない
 
第5章 データフィケーション
「すべてのもの」がデータ化され、ビジネスになる時代
 
第6章 ただのデータに新たな価値が宿る
ビジネスモデルの大変化 その1
 
第7章 データを上手に利用する企業
ビジネスモデルの大変化 その2
 
第8章 リスク ビッグデータのマイナス面
『1984』の悪夢は実現するか
 
第9章 情報洪水時代のルール
ビッグデータ時代のガバナンスとは
 
第10章 ビッグデータの未来
ここまで述べてきたことの「まとめ」

 Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>