原題:Data for the People: How to Make Our Post-Privacy Economy Work for You (Basic Books, 2017)
著者:Andreas Sebastian Weigend(1961-) ビッグ・データ。物理学。元・Amazonチーフ・サイエンティスト。
訳者:土方 奈美[ひじかた・なみ] 翻訳
装丁:永井 翔[ながい・しょう](1982-) 文藝春秋デザイン部。
NDC:007.3 情報と社会:情報政策
『アマゾノミクス データ・サイエンティストはこう考える』アンドレアス・ワイガンド 土方奈美 | 単行本 - 文藝春秋BOOKS
【目次】
目次 [001-004]
序章 常識を逆転させたアマゾン 011
ソーシャルデータの量は一八ヶ月ごとに倍増
ツイッターやフェイスブックから唯一無二のあなたが浮かび上がる
ジェフ・ベゾスと気付いたeコマースのスタンダード
医療アプリの情報で保険会社から高額な請求を受ける?
従来の知る権利は強すぎると同時に弱すぎる
「過去にも同じものを買っています」とアマゾンがアラートする理由
カスタマーレビューの基準は役に立つかどうか
常識を逆転させてきたアマゾン
本書はデータエコノミーの新たなルールを検討する
第1章 データの積み重ねが財産になる 029
1節 毎日100億回以上グーグル検索される 030
情報は二一世紀の石油
不可欠になる情報リテラシー
ウェブ以前、天からの恵みだったセグメント分析
顧客セグメントの大きさが「一人」になる
「〇・一人」規模でセグメントする アマゾン
アメリカの購買プロセスの半分はアマゾン検索から
グーグルは検索結果のランクをどう決めているか
何十億ものソーシャルデータが日々追加される
個人データへの金銭的報酬は成立しない
「探求」と「深掘り」のジレンマ
「絶対的な理想の相手」か「とりあえずの理想の相手」か
なぜグーグル・ナウはフライト時刻の入力ミスを指摘できたのか
あなたが写っていない写真へのタグ付けはノイズか?
2節 データはA/Bテストで毎分精製される 055
毎日一億人以上の地理位置情報を分析するインデックス
なぜ閲覧から購入までの八時間のタイムラグが生まれたのか?
クリスマスシーズンに配送スタッフをどれだけ増やすか
推進ジェットの発射指示を行った NASA のエンジニア
グーグルは青色の濃淡をA/Bテストで決めた
ウェブサイトにおけるA/Bテストの落とし穴
実験結果が分単位で往復する世界
第2章 「いいね!」はあなたを映す鏡 067
1節 プライバシーは幻想である 068
一七世紀に煙突がもたらしたプライバシー
一九世紀末ボストンの弁護士がプライバシー権を主張する
最もプライベートな交信を「読まれる」Gメール
世界人口の四人に一人がフェイスブックに登録
進んで人生を「公開」する時代
性別、誕生日、郵便番号が分かればアメリカ国民の六三%を特定できる
ネットフリックスの匿名デビューから個人を特定する
アマゾンでは購入履歴を自ら変更できる
「いいね!」はあなたの性格を映し出す
ネットに投稿された写真からパーティー好きか孤独な冒険者に分類される
フェイスブック以前は偽名が当たり前だった
タッチスクリーンを強く叩くか、穏やかに触れるか
偽名により社会的評価を得る
なぜアマゾンはレビュアーに実名を強制しなかったか
オンライン掲示板レディットは機械学習を使って「不正投票」を抑える
クリック数や連絡メッセージが示す「正直シグナル」
メッセージ数や返信するまでの時間を公表するダッシュボード
2節 ネット上で「忘れられる権利」 102
通話の両サイドに相手の身元を知る権利がある?
「忘れられる権利」これによる削除要請は一年で二七万五〇〇〇件以上
チャットのスクリーンショット公開にはどんな判断が下る?
第3章 そのつながりが経済を動かす 109
1節 ザッカーバーグが広めた「ソーシャルグラフ」 110
フェイスブック上で変化し続ける対話型データ
数学の一分野から始まり、ザッカーバーグが広めた「ソーシャルグラフ」
ネット以前のソーシャル・ネットワーク研究
電話やメールからソーシャルグラフを築く
フェイスブックのアルゴリズムは人間関係の微妙な差異を読み取る
「二人の個人の関係はすべて、そこに含まれる秘密の度合いで決まる」
ニュースフィードのコンテンツを決める正直シグナルや痕跡
「通話先グラフ」を利用したマーケティングの契約率は五倍に
リンクトインの抱えていた厄介なアンバランス
職業上のスキル推薦という「きっかけ」
リンクトインでは実名か匿名かで受けられるサービスが異なる
フェイスブックにも対称性のレベルの選択肢が欲しい
フェイスブックと微信(WeChat)はどこが違うか
他人の友達リストを見られない微信
フェイスブックは一〇〇日前から交際を予見する
六二・五%がフェイスブックの表示がアルゴリズムであると知らない
雨の日の否定的な感情が晴れた都市の友達に伝播する
感情の伝播の実験を事前に知らせるべきか?
フェイスブックが親しくすべき友達を教えてくれる?
ソーシャルな広告メッセージは三四万人を投票に向かわせた
2節 信頼が新たな市場を生み出す 151
ソーシャルグラフでは「信頼」を測定できる
ウーバーやエアビーアンドビーにおける信頼の構築
データ会社が用意すべきパーソナライゼーション機能
フェイスブックの友達リストで保険や融資契約が判断される?
「評価カップリング」と「ピア・トゥ・ピア保険」
ソーシャルグラフ上に誕生する信頼の市場
ソーシャルグラフ・データによってよりよい意思決定を導く
第4章 1兆個のセンサーがあなたを記録する 165
1節 位置も人間関係も感情もすべて読み解く 166
グレイを救ったダッシュボード・カメラの記録
イギリスには国民三〇人に一台、監視カメラがある
二〇二〇年までに世界のセンサーは一兆個に
グーグルグラスを一年着用し続けた社会実験
どこにでもセンサーがある環境における三つの不安
センサーによるデータを人工知能がラベリングする
午前四時ラスベガスの ATM は警告する
一〇年以内に所有物のほぼ全てに位置トラッカーが付く
小売業者が無料 wi-fiを提供する理由
顔認識ソフトウエアから身を守ることは難しい
一〇メートル先のカメラから虹彩をスキャンする
毎月一億件追加されるナンバープレートの情報
「アマゾン・エコー」は常に聞き耳を立てている
センサーデータが構築するソーシャルグラフ
金融機関が試験導入した心電図ブレスレット
センサーデータの悪用から身を守る方法はあるか?
世界の異なる地域で感情表現が普遍的だと発見したエクマン
苦痛の表情を読み取るのはコンピューターの方が優れている
膨大な会話のアーカイブから作られた声の感情ライブラリ
心拍数、血液、汗、呼気から感情を読み取る
感情センサーを自動車に組み込む「オート・エモーティブ」
感情解釈における「オセロの失敗」
わずかな目の動きから「関心」も正確に把握できる
眼球追跡装置でプログラミング初級者の学習能力を高める
視線から集中力を観察し、測定するアプリ
職場の人間関係グラフを描く「ソシオメトリック・バッジ」
意思決定の際の脳内をスキャンする fMRI
2節 「偽の自分」はつくれない 212
五週間「偽り」のタイ旅行
ウェアラブルカメラでいつ撮影するかは警察官の裁量に委ねられている
第5章 もしフェイスブック・ユーザーが死んだら 217
データ会社を評価するための六つの権利
「自分のデータにアクセスする権利」とは
「過去」や「ピア(仲間)」との比較でデータに意味が生じる
フェイスブック・ユーザーの死亡後、誰がアカウントを管理するか
EUはコンピューターによるタグ付けに異議を唱えた
タグ付けされた画像を誰に見せるか選択できるべき
「データ会社を調べる権利」と測定すべき三つの指標
データの安全性監査を確認する権利
セキュリティ侵害の多くが社内の人の問題に端を発する
徹底的な監視をしてもロボットがデータを抜き取る
四〇〇万ドル以上を善玉ハッカーに支払ったフェイスブック
データの安全性について五つの観点から評価する
プライバシー効率評価を確認する権利
アマゾンでは商品を推奨するのに顧客を特定できる情報は必要ない
プライバシー効率の公表は自動車の燃費効率と同じくらい簡単だ
プライバシー効率を評価し、公表する独立機関が必要だ
「データへのリターン」を確認する権利
「データへのリターン」の分母はユーザーの労力・関心
「データへのリターン」の分子はデータ会社から得る価値
データ会社を他の人に進める可能性を点数で評価する
健全性を示す指標がパッと見てわかるダッシュボード
第6章 ウーバーのドライバーは悩んでいる 259
あなたにとって「スパム」か「スパムではない」かを設定する
正確なデータを維持するのではなく「データを修正する」
EUの「忘れられる権利」よりも大きな主体性を
自分に関するデータへの反論、説明、否認を「ピン(固定)」する
分割、改竄や消去ができないブロックチェーンの仕組み
どれくらい詳細な情報を共有するかを決める「データをぼかす権利」
個人情報のレベルをどれだけぼかすか選択できるリンクトイン
何を読んでいるかをアマゾンに情報提供したらFBIが玄関に?
ユーザーがデータ会社を使って実験する「設定変更の権利」
アマゾンはユーザーの都市や州から商品を推奨する
データ会社の設定をあれこれ試すことで意思決定がどう変化するのか
ハーバードとスタンフォードのどちらかを選んだ場合のトレードオフ
データをコピーし、別のデータ会社に持ち込む「ポートする権利」
イーベイやアマゾンに悪徳業者が捏造データをポートするのを防ぐために
ウーバーのドライバーはライバル企業を試すかどうかの選択を迫られる
データをポートすることで配車サービスにスタードライバーが生まれる?
機械に意思を伝え、人間が決定権を握る
第7章 データエコノミー 293
1節 小売・金融・職場・教育 294
どの牧場のウールで作られたか追跡できるニュージーランドのセーター
電波の使用状況に基づいて鬱病のアラートを出す
アメリカン航空のデータをユナイテッド航空にポートできたら
ソーシャルデータを活用して短期信用貸しをするアフォーム
アリババはどこで誰と食事をしたかをクレジットスコアに算定する
融資判断のためソーシャルグラフの「友達」を削除する
八〇万人以上のデータを集め、証券会社の扉をこじ開けたシグフィグ
部下にメールの受信箱と送信箱を公開し、社内の苦情を激減させる
職場でのデータ収集・分析への従業員から見たリターン
リンクトインの調査チームはリーマン・ブラザーズ破綻を事前に悟った
ソーシャルデータから従業員数を最適化するパーコレーター
Q&Aサイトの回答からデータ・サイエンティストを採用する
社内での徹底的透明性を追求するブリッジウォーター
職業上の評判や作業の評価データをポートする
学生同士に議論させるウェブベースの教育システム
遠く離れた学生と教員のやり取りをリアルタイムで分析する
教育データを取りつづけ、将来の仕事の適性を予測する
2節 医療・公正さ 323
年に一回の健康診断だけ医者を訪れるのでは不十分
医師のメモへのアクセスを提供した「オープンノート」
活動量計のデータや食事のカロリーで医療記録を修正する
センサーデータで患者の治療を改善する
遺伝子検査とデータの安全性・プライバシー効率
ソーシャルグラフが健康に及ぼす影響
データ会社の参入により予測型医療への転換が進む
解決すべき「公正さ」という問題
例えば駐車場という公共の資源を支配されないために
エピローグ データをわれわれの手に取り戻す 339
謝辞(二〇一六年八月 上海とサンフランシスコにて) [342]
ソースノート [343-393]
訳者あとがき(二〇一七年六月 土方奈美) [394-397]
【抜き書き】
□204-205
◆眼球追跡装置でプログラミング初級者の学習能力を高める
マイクロサッカードは一度未満のきわめて細かい動きなので、人間がその場で認識するのは難しい。しかしスウェーデンのトビー・グループなど、複数の企業がマイクロサッカードをとらえ、分析できる眼球追跡装置とソフトウエアを開発している。眼球追跡装置は通常、被験者の眼球に向けて、LEDから赤外線を放射する。 赤外線は人間の目には見えないものの、赤外線カメラは角膜からの反射を探知し、眼球の位置と向きを推測できる。トビー・グループが作っているメガネのような眼球追跡装置は「現実世界」でも使える。 たとえば店内を歩いているとき顧客が何に関心を持つのか、話すことのできない幼児がどのように知覚的認知的能力を身につけていくのか、といったことの分析が可能になる。トビーにはメガネを使わず、コンピュータ画面に直接接続するシステムもある[93 2015年12月16日、著者によるトビー・テクノロジーのナレッジサービス・ディレクター、ウィルキー・ウォンのインタビューより。]。ただまだ克服すべき課題はいくつもある。たとえば日光や白熱電球などの光源によって、赤外線センサーへのシグナルが歪んでしまうこともある。知覚的あるいは感情的な刺激に加えて、明るさの変化によっても瞳孔の開き具合が変化してしまうことで、被験者の視線を追跡し、関心を測定するのが難しくなることもある。
眼球追跡装置を使って、凝視やマイクロサッカードのレベルまで視線を正確に追跡しようと思えば、キャリブレーション(較正)が必要だ。 実験室や街中で、ユーザーにキャリブレーションのためのテストを受けてもらうという手もあるだろう。優秀な研究者によって、ユーザーにそうと悟られずに装置をキャリブレーションする方法も開発されている。たとえば被験者の注意を引くような画像をスクリーンに表示し、被験者がそれを見ているうちにキャリブレーションをしてしまう、といったことだ。
トビーは眼球追跡のデータを、心拍数、呼吸数、皮膚電気反応(皮膚の伝導性の度合い)など、認知を示す生理的データと関連づける方法を探っている。 いずれもわれわれが刺激に反応したときに変化するもので、関心や興味の高まりを推測する有力な手がかりとなる。 複数の生理的センサーのデータと組み合わせて分析することで、眼球追跡装置は何が目に映ったために特定の感情的反応が引き起こされたかを推測することができる。
眼球追跡装置のデータを活用することで、個人のトレーニングやパフォーマンスの向上につながると期待されている。 上級者が困難な状況に対応するときの目の動きをまねさせることで、初級者を訓練できることが複数の研究によって示されている。 ある研究では、コンピュータ・コードを勉強している学生が、コンピュータを使った学習システムで課題を見ているときの目の動きを追った。その結果、初級レベルの学生はそれぞれの問題のごく一部しか見ず、解決方法を考えながら同じ資料を何度も何度も見返していた。それに対して上級レベルの学生がコードを考えるときには、はるかに多くの情報を目で追っていた。 研究者によると、上級者の視線のパターンを見せることで、初級者の学習速度を高められるという。同じデータは、初級者が見落としていた重要な情報を後から示すのにも使える[94]。
同じような眼球追跡データの分析は、X線画像を見て小結節や腫瘍を見つける放射線医の初期訓練でも使われてきた[95]。 新米放射線医は、ベテランと仲間の新米医師の視線のパターンの両方から学習する。 同じ新米でも、みながそろって同じ腫瘍を見逃すとは限らないからだ。
このような視線追跡データも、精製の対象となる。医師の視線パターンと、X線画像からコンピュータが抽出したデータを比較することで、機械学習システムは人間が犯しがちなミスを予測することができた[96]。いずれ視線追跡システムは、医師の診断の質を高めるのにも役立てられるだろう。