Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

いまさら聞けないビッグデータ Vol.3 Watson編

あるある アナリティクス - 第3回 天王洲ナイト
by

Norihiko Nakabayashi

on 1 February 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of いまさら聞けないビッグデータ Vol.3 Watson編

ガソリンスタンド
油田開発
モータリゼーション革命
個人の行動範囲が飛躍的に拡大
1900年のニューヨーク
1980年代までの業務処理
大型汎用機
金融
製造
ビッグデータ革命
消費
流通
ヘンリー・フォード(1863〜1947)
1908年 フォードT型 販売開始
自動車元年?
馬車の種類を
知っていますか?
自動車はすぐに壊れるし、
ガソリンがなくなったら動かなくなる
法整備
販売店
都市に郊外が出現
街路には馬車が溢れていた時代
現在のニューヨーク
自動車中心の世界に
信号機
次第に環境が整ってくる
道路標識
近代経済の
爆発的成長

現在の業務処理
Webシステム
学術
医療
個人の行動から、行政、学術、そして、あらゆる産業において膨大な情報が、
今この瞬間も生み出されている
道路整備
修理工場
©Uris
©Psongco
©Bundesarchiv
©Bundesarchiv
自動車会社
行政
クラウド環境
ソーシャル・ネットワーク
モバイル機器
モータリゼーション時代
ある日突然変わるわけではなく
Cabriore
Wagon
Coupe
IoT・センサー技術
気が付くと、当り前になっている
新しい技術が引き起こす情報爆発
巨大な資源としての情報
①定例・臨時報告
「先月のトレーニング実績は?体組成計による体重や体脂肪、3サイズの測定結果は?」
月初に前月分までのデータを集計し報告書を作成する。一定期間のデータを集計して結果を確認する。定型的な集計表で定期的に出力される状態。

②調査(原因特定)
「1ヶ月で下半身の体脂肪が急増した理由は何か?」
トレーニング項目や日時などの切り口でデータが整備されドリルダウンできる状態になっている。ドリルダウンできるようになっていると調査ができる、ということである。

③警告
「3ヶ月間のデータを時系列で見ると、筋肉量が落ち体脂肪が増加していて、インストラクターからもこのままではマズイと言われる」
前月・前年比で明らかにおかしい状況になっている、といったことが比較できる状態。他の状況(過去の動向)と比べて著しく差異が生じていることを警告する。勘と経験に基づいたしきい値ができてくる。そりゃあダメだろう、の世界観。客観的な根拠が無い世界。
④統計分析
「あなたと同世代の男性の平均値と比べて、XX Kg 太っている。体脂肪率も○○ %多い」
基本的な統計量(平均値、最小値、最大値など)を算出し、意思決定の参考にする。根拠がなかった原因、差異などについて、統計学的に正しい手続きで確認が行われ、共有されている状態。指示がより統計的に合理的なものさしに従って行われる。過去のトレンドから振り返る。

新⑤ 基本的な予測・推計
「このままの生活習慣を続けると△ヶ月後にメタボ予備軍になってしまうので、経験的な対策を集団に対して実施」
予測モデルを構築。ここからが予測の話が始まる。1年後、3年後にはこうなっているので、今、何か施策を実施すべき。過去の経験から、この状況だとこの施策が効いたよね、みたいな話。データマイニング手法を使っても良い。

新⑥ 高度な予測・推計
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%であり、個別の健康指導を実施」
既往歴や健康状態など複数の情報を組み合わせた予測モデル
このへんからデータの解像度を上げていく、というような話。複数のデータを組み合わせて使いましょう、という話がこちらになってくる。Non One to One の範囲で。

新⑦ 最適化
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%のため、生活習慣改善のトレーニングメニューを自動作成しAさんのスマホアプリに定期的に送信」
ひとりひとりという究極のドリルダウンができている状態。個々人に最適化された施策等、個々の患者の生活習慣や病状に合わせた予測モデル。One to Oneの世界。

新⑧ リアルタイムでの最適化
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%のため、レーニングメニューが自動作成されカレンダーの空き時間に合わせて社員用フィットネスクラブの予約もされる」
個々人のモデルによるリアルタイム警告・アクション。

競争力
データ活用の成熟度
サービスの高度化
競争優位
いまさら聞けない
ビッグデータ
①定例・臨時報告
「先月のトレーニング実績は?体組成計による体重や体脂肪、3サイズの測定結果は?」
月初に前月分までのデータを集計し報告書を作成する。一定期間のデータを集計して結果を確認する。定型的な集計表で定期的に出力される状態。

②調査(原因特定)
「1ヶ月で下半身の体脂肪が急増した理由は何か?」
トレーニング項目や日時などの切り口でデータが整備されドリルダウンできる状態になっている。ドリルダウンできるようになっていると調査ができる、ということである。

③警告
「3ヶ月間のデータを時系列で見ると、筋肉量が落ち体脂肪が増加していて、インストラクターからもこのままではマズイと言われる」
前月・前年比で明らかにおかしい状況になっている、といったことが比較できる状態。他の状況(過去の動向)と比べて著しく差異が生じていることを警告する。勘と経験に基づいたしきい値ができてくる。そりゃあダメだろう、の世界観。客観的な根拠が無い世界。
④統計分析
「あなたと同世代の男性の平均値と比べて、XX Kg 太っている。体脂肪率も○○ %多い」
基本的な統計量(平均値、最小値、最大値など)を算出し、意思決定の参考にする。根拠がなかった原因、差異などについて、統計学的に正しい手続きで確認が行われ、共有されている状態。指示がより統計的に合理的なものさしに従って行われる。過去のトレンドから振り返る。

新⑤ 基本的な予測・推計
「このままの生活習慣を続けると△ヶ月後にメタボ予備軍になってしまうので、経験的な対策を集団に対して実施」
予測モデルを構築。ここからが予測の話が始まる。1年後、3年後にはこうなっているので、今、何か施策を実施すべき。過去の経験から、この状況だとこの施策が効いたよね、みたいな話。データマイニング手法を使っても良い。

新⑥ 高度な予測・推計
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%であり、個別の健康指導を実施」
既往歴や健康状態など複数の情報を組み合わせた予測モデル
このへんからデータの解像度を上げていく、というような話。複数のデータを組み合わせて使いましょう、という話がこちらになってくる。Non One to One の範囲で。

新⑦ 最適化
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%のため、生活習慣改善のトレーニングメニューを自動作成しAさんのスマホアプリに定期的に送信」
ひとりひとりという究極のドリルダウンができている状態。個々人に最適化された施策等、個々の患者の生活習慣や病状に合わせた予測モデル。One to Oneの世界。

新⑧ リアルタイムでの最適化
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%のため、レーニングメニューが自動作成されカレンダーの空き時間に合わせて社員用フィットネスクラブの予約もされる」
個々人のモデルによるリアルタイム警告・アクション。

競争力
Before
Afrer
データ
テクノロジー
活用範囲
過去のデータにもとづく振り返り
売上実績
在庫実績
未来の予測 = 顧客の購買行動を予測
天候の売れ筋との隠れたつながり
顧客が求める商品を必要な量だけ用意
ムダを作らない正確な販売予測
過去のデータからのパターン発見
予測
にもどづくアクション
基幹業務システム
データウェアハウス
レポーティングシステム
データマイニング
予測分析
大量データ分析
リアルタイム処理
テキスト分析
音声解析
画像解析
既存の構造化されたデータ
売上管理システム
財務管理(ERP)
顧客管理(CRM)
業務システムDB
物流管理(SCM)
在庫管理システム
生産管理システム
地図情報・位置情報
RFID
医療データ
システムログ
気象データ
オープンデータ
IoT・センサーデータ
M2M
ソーシャルメディア
Webサイト
あいまいな情報から精度の高い洞察を獲得する
ニュースサイト
ドキュメント
写真・画像
動画・音声
より複雑なデータ
コールセンター
音声記録
①定例・臨時報告
「先月のトレーニング実績は?体組成計による体重や体脂肪、3サイズの測定結果は?」
月初に前月分までのデータを集計し報告書を作成する。一定期間のデータを集計して結果を確認する。定型的な集計表で定期的に出力される状態。

②調査(原因特定)
「1ヶ月で下半身の体脂肪が急増した理由は何か?」
トレーニング項目や日時などの切り口でデータが整備されドリルダウンできる状態になっている。ドリルダウンできるようになっていると調査ができる、ということである。

③警告
「3ヶ月間のデータを時系列で見ると、筋肉量が落ち体脂肪が増加していて、インストラクターからもこのままではマズイと言われる」
前月・前年比で明らかにおかしい状況になっている、といったことが比較できる状態。他の状況(過去の動向)と比べて著しく差異が生じていることを警告する。勘と経験に基づいたしきい値ができてくる。そりゃあダメだろう、の世界観。客観的な根拠が無い世界。
④統計分析
「あなたと同世代の男性の平均値と比べて、XX Kg 太っている。体脂肪率も○○ %多い」
基本的な統計量(平均値、最小値、最大値など)を算出し、意思決定の参考にする。根拠がなかった原因、差異などについて、統計学的に正しい手続きで確認が行われ、共有されている状態。指示がより統計的に合理的なものさしに従って行われる。過去のトレンドから振り返る。

新⑤ 基本的な予測・推計
「このままの生活習慣を続けると△ヶ月後にメタボ予備軍になってしまうので、経験的な対策を集団に対して実施」
予測モデルを構築。ここからが予測の話が始まる。1年後、3年後にはこうなっているので、今、何か施策を実施すべき。過去の経験から、この状況だとこの施策が効いたよね、みたいな話。データマイニング手法を使っても良い。

新⑥ 高度な予測・推計
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%であり、個別の健康指導を実施」
既往歴や健康状態など複数の情報を組み合わせた予測モデル
このへんからデータの解像度を上げていく、というような話。複数のデータを組み合わせて使いましょう、という話がこちらになってくる。Non One to One の範囲で。

新⑦ 最適化
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%のため、生活習慣改善のトレーニングメニューを自動作成しAさんのスマホアプリに定期的に送信」
ひとりひとりという究極のドリルダウンができている状態。個々人に最適化された施策等、個々の患者の生活習慣や病状に合わせた予測モデル。One to Oneの世界。

新⑧ リアルタイムでの最適化
「Aさんは△ヶ月後に生活習慣病になる可能性がXX%のため、レーニングメニューが自動作成されカレンダーの空き時間に合わせて社員用フィットネスクラブの予約もされる」
個々人のモデルによるリアルタイム警告・アクション。

競争力
IoT x Big Data
精密なバイタルサインの取得
2010年 アルテミスプロジェクト
カナダ・オンタリオ工科大学
合併症や院内感染を防ぐためには
24時間以内の異常発見
が求められる
血圧、心拍数、呼吸、体温を筆頭に無数のバイタルサインをモニタリング
毎秒1000項目を超える
データがセンサーから生成
IBM ワトソン研究所
ビッグデータ分析の活用
医学・医療技術の発展
カナダ・トロント大学
”我々が直面する課題は、
データが多すぎる
という
事です。多忙を極めるNICUにおいて、提示される
情報をすべて吸収し、治療に反映するには
人間が処理できるキャパシティを超えてしまっている
のです”
トロント大学 アンドリュー・ジェームス医師
様々な医療機器や
センサーからの情報
蓄積された大規模な情報から、
より深い分析
を実行
データ統合
分析モデル
として登録
Data Mining
(相関関係の発見)
例)
動脈血酸素飽和度<85%
観血的動脈血圧の20秒平均<在胎週数


心肺停止の兆候
これまでよりも6時間~24時間、
早期に処置を施すことが可能に
リアルタイムに異常を検知
Database/
Warehouse
新生児集中治療室(NICU)
情報をストリームのまま、
リアルタイムに解析
リアルタイムに異常を検知
死亡率の低下
2000年頃のチーム(40人)の平均年俸
350万ドル
120万ドル
1勝にかけたコスト
打率
盗塁数
打点
野手
投手
球速
防御率
勝利数
セーブ数
一般的に重要視される指標
これらの指標と過去の経験から古参のスカウトマンが選手を選ぶ
アスレチックスが重要視した指標
出塁率
長打率
選球眼
野手
投手
奪三振
与四球率
被本塁打
被長打
新しい指標で選手を分析してみると、
”良い”選手
が多数の大学・アマチュア野球・他チームのマイナーリーグに
埋もれていた
例外なく
高額な年俸
期待値に対して
割安な年俸
300万ドル
50万ドル
(2000年~2002年平均)
同時期に最もコスト効率が悪かった球団
オークランド・アスレチックスのデータ分析活用
1勝にかけたコスト
「バイブル」
2000年から2003年まで4年連続プレーオフ出場の快挙を達成
メジャーリーグチーム
アナリティクス活用の結果
アスレチックス
インディアンズ
N.Y ヤンキース
アスレチックス
ビッグデータ時代
2020 東京五輪向けサービス
5年後、世界で最高のサービスを日本から
Why Big Data ?
競争優位
フィットネス
洋菓子店
病院
Vol.3 Watson編
ビッグデータ & アナリティクス
テクノロジーの積み上げ
ベストなタイミングでの”センス&レスポンド

「人工知能(AI)
のようなもの

Watson テクノロジー
Full transcript