Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

スタートアップがデータサイエンスを武器に強くなる

Datapalooza Tokyo 2016
by

Norihiko Nakabayashi

on 7 July 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of スタートアップがデータサイエンスを武器に強くなる

成長期
"日々蓄積されるデータの活用フェーズ"
サービスの高度化
データが溜まってくるので”データ”自身が価値になる
分析結果も含めたAPI提供による更なるデータの価値
データエクセレンスへの道程
サービスの成長に合わせ、各フェーズで押さえるべきポイント
創業期
"データの構造やデータベースをしっかり作る"
サービス立上げ期
"アーキテクチャを確立"
忍耐期
安定期
"オートメーション化, データでも儲ける"
変革期
"20 Years Later"
データサイエンスの使いどころも意識して、サービスやプロダクトを準備する
”ビッグデータ”、”人工知能”、”IoT”の本質
重要なエンティティに関するデータ項目を洗い出す
顧客やサービス・プロダクト
”CREATE TABLE”はデータサイエンティストがやる
データエクスチェンジ
API連携によるデータ交換・売買
”街のお菓子屋さん”もアナリティクスネイティブ
次の形態へのトランスフォーム
サービスがプロトタイプ、α版、β版と進化
アーキテクチャを固める重要な時期
”分析”&”オペレーション”融合システム
最初からオペレーションへ組み込んでおく
モデルのポータビリティ
ユーザ獲得のための色々な施策を展開
色々やるけどデータベース構造だけはしっかりキープ
外部サービスとのデータ連携をしっかり
Google AnalyticsやFacebook広告など
FB広告 / GA / MySQLのデータが分断されているとつらい
ユーザ獲得のためのデータサイエンス
PDCA →
DCAP
でサイクルを超早く回す
次のフェーズへの準備を怠らない
データがどんどん増えていく
スタートアップがデータサイエンスを武器に強くなる
データサイエンスラボ
中林 紀彦
アナリティクスネイティブ
1990年代後半インターネット涼明機に、新しい流れに乗ってWebへの準備が出来ていた企業が急成長できたように、2010年代後半からは
”データ”に対して十分な準備ができている企業
が今後10年で大きく成長していくであろう。
データエクセレンス・カンパニー
Why スタートアップ?
企業の時価総額ランキング
インターネットネイティブ、Webネイティブ
データ戦略
事業戦略に基づいたデータ構造を定義
インフラ・技術
データストア(RDBMS、Hadoop)
クエリー(SQL、NoSQL)
組織・人材・スキル
データエンジニアリングの素養
機械学習、深層学習(Deep Learning)
Apahce + PHP + PostgreSQL
Ruby on Rails
自己紹介
電子部品メーカー
情報システム部
営業企画室
外資系ITベンダー
プリセールスエンジニア
マーケティングマネージャー
営業部長
インキュベーション
データサイエンスラボ
副所長(事業開発)
ラクスル
データサイエンティスト
筑波大学大学院
客員准教授
クラウド
"データ構造を維持し続ける"
データ戦略
分析が組み込めるオペレーションシステムの構築
インフラ・技術
Webサービス・フレームワーク
Python Webフレームワーク(Django、Tornado)
組織・人材・スキル
データエンジニアリングもできるPythonエンジニア
インターネットネイティブが
大きな競争優位だった
このフェーズでフルタイムの
データサイエンティストは必要か?
素材がないので、まだ料理できない
今後5年で新しいアーキテクチャが確立されていく
このフェーズでフルタイムの
データサイエンティストは必要か?
そろそろ調理の準備が必要
大企業はどうなの?
1999年
創業メンバーとデータに関わる戦略を議論し、必要なデータ項目を洗い出す(週イチ~隔週)
人工知能系のサービスの場合にはフルタイム必須
分析環境も構築できる
サーバーサイドエンジニア
(兼任でフルタイム)
データ戦略
顧客獲得のための施策をサポートする
インフラ・技術
仮説検証(DCAP)が素早く回せる
施策の自動化
組織・人材・スキル
データサイエンス分野のスキル
データサイエンスとデータエンジニアリングができ、常に社内にいてコミュニケーションを密に取りながら進める
データサイエンスチームを作る
(フルタイム x 2)
このフェーズからのスタート
データも溜まってきたしそろそろデータサイエンティスト入れようか?
色々な課題が浮き彫りになる
データ戦略
蓄積されているデータ自身に価値を持たせる
インフラ・技術
ビッグデータを格納する基盤
大量データを分析するサーバーサイド環境
並列処理やGPUなど
組織・人材・スキル
業界知識、ビジネススキル
ビジネスを良く理解していて、”データ” 自体に価値を付けることが出来る
(フルタイム x 3)
アナリティクスネイティブ
1990年代後半インターネット涼明機に、新しい流れに乗ってWebへの準備が出来ていた企業が急成長できたように、2010年代後半からは
”データ”に対して十分な準備ができている企業
が今後10年で大きく成長していくであろう。
データエクセレンス・カンパニー
データエクセレンス・カンパニーへ!
アプリケーションサーバ
フレームワーク
大企業のデジタルシフト
ユーザ数 < 3桁
CTDO
C
hief
T
echnology
D
ata
O
fficer
大企業も
失敗パターン
データありきで始めてしまう
「うちもビッグデータやろう」
「データ渡すから何か見つけて」
システムやデータベースがスパゲッティ
「どこにデータがあるか分からない」
「このカラム名って何だっけ?」
必要なデータが取れていない
「ユーザーの異動履歴ないんだっけ?」
時、既に遅し、、、
データ戦略
データを通貨のように流通させる
インフラ・技術
さまざまなシステムとのデータ、API連携
ガバナンス、セキュリティ
組織・人材・スキル
事業開発、業界知識、ビジネススキル
pickle モジュールは Python オブジェクトの直列化および直列化されたオブジェクトの復元のためのバイナリプロトコルを実装
Pythonでの分析結果をそのままWebサービス化
学習済みモデルのポータビリティ
Tornado
学習と実行は別環境で
深層学習はGPU環境などリッチなリソース環境で行う
モデル更新のタイミングでインスタンスを起動すればよい
ユーザー数 > 4桁~6桁
既にデータサイエンティストではない?
アナリティクスネイティブ
モバイルネイティブ
どこにいるのか?
どうやって探すのか?
”育てる”
どこまで自前で持つのか?
Full transcript