Introduzione 

Prezi AI.

Il tuo nuovo assistente di presentazione.

Perfeziona, migliora e personalizza i tuoi contenuti, trova immagini pertinenti e modifica le immagini più velocemente che mai.

Caricando...
Trascrizione

Why スタートアップ?

Apahce + PHP + PostgreSQL

このフェーズでフルタイムの

データサイエンティストは必要か?

  • 学習と実行は別環境で
  • 深層学習はGPU環境などリッチなリソース環境で行う
  • モデル更新のタイミングでインスタンスを起動すればよい

今後5年で新しいアーキテクチャが確立されていく

このフェーズからのスタート

  • データも溜まってきたしそろそろデータサイエンティスト入れようか?
  • 色々な課題が浮き彫りになる

失敗パターン

  • データありきで始めてしまう
  • 「うちもビッグデータやろう」
  • 「データ渡すから何か見つけて」
  • システムやデータベースがスパゲッティ
  • 「どこにデータがあるか分からない」
  • 「このカラム名って何だっけ?」
  • 必要なデータが取れていない
  • 「ユーザーの異動履歴ないんだっけ?」

時、既に遅し、、、

データ戦略

  • 事業戦略に基づいたデータ構造を定義

インフラ・技術

  • データストア(RDBMS、Hadoop)
  • クエリー(SQL、NoSQL)

組織・人材・スキル

  • データエンジニアリングの素養
  • 機械学習、深層学習(Deep Learning)

創業メンバーとデータに関わる戦略を議論し、必要なデータ項目を洗い出す(週イチ~隔週)

人工知能系のサービスの場合にはフルタイム必須

データ戦略

  • 分析が組み込めるオペレーションシステムの構築

インフラ・技術

  • Webサービス・フレームワーク
  • Python Webフレームワーク(Django、Tornado)

組織・人材・スキル

  • データエンジニアリングもできるPythonエンジニア

分析環境も構築できる

サーバーサイドエンジニア

(兼任でフルタイム)

データ戦略

  • 顧客獲得のための施策をサポートする

インフラ・技術

  • 仮説検証(DCAP)が素早く回せる
  • 施策の自動化

組織・人材・スキル

  • データサイエンス分野のスキル

データサイエンスとデータエンジニアリングができ、常に社内にいてコミュニケーションを密に取りながら進める

データサイエンスチームを作る

(フルタイム x 2)

データ戦略

  • 蓄積されているデータ自身に価値を持たせる

インフラ・技術

  • ビッグデータを格納する基盤
  • 大量データを分析するサーバーサイド環境
  • 並列処理やGPUなど

組織・人材・スキル

  • 業界知識、ビジネススキル

ビジネスを良く理解していて、”データ” 自体に価値を付けることが出来る

(フルタイム x 3)

アナリティクスネイティブ

データエクセレンスへの道程

サービスの成長に合わせ、各フェーズで押さえるべきポイント

スタートアップこそが

データサイエンスを武器に強くなれる

自己紹介

SOMPO Digital Lab 中林 紀彦

  • 電子部品メーカー
  • 情報システム部
  • 営業企画室
  • 外資系ITベンダー
  • プリセールスエンジニア
  • マーケティングマネージャー
  • 営業部長
  • インキュベーション

安定期

データ戦略

  • データを通貨のように流通させる

インフラ・技術

  • さまざまなシステムとのデータ、API連携
  • ガバナンス、セキュリティ

組織・人材・スキル

  • 事業開発、業界知識、ビジネススキル
  • データサイエンスラボ
  • 副所長(事業開発)
  • ラクスル
  • データサイエンティスト
  • SOMPO
  • データ戦略統括
  • 筑波大学大学院
  • 客員准教授

"オートメーション化, データでも儲ける"

既にデータサイエンティストではない?

ユーザー数 > 4桁~6桁

大企業も

成長期

アナリティクスネイティブ

  • データエクスチェンジ
  • API連携によるデータ交換・売買
  • ”街のお菓子屋さん”もアナリティクスネイティブ

1990年代後半インターネット涼明機に、新しい流れに乗ってWebへの準備が出来ていた企業が急成長できたように、2010年代後半からは”データ”に対して十分な準備ができている企業が今後10年で大きく成長していくであろう。

"日々蓄積されるデータの活用フェーズ"

大企業はどうなの?

データエクセレンス・カンパニー

  • サービスの高度化
  • データが溜まってくるので”データ”自身が価値になる
  • 分析結果も含めたAPI提供による更なるデータの価値

CTDO

Chief Technology Data Officer

企業の時価総額ランキング

1999年

クラウド

モバイルネイティブ

Ruby on Rails

フレームワーク

忍耐期

インターネットネイティブ、Webネイティブ

アプリケーションサーバ

大企業のデジタルシフト

"データ構造を維持し続ける"

ユーザ数 < 3桁

インターネットネイティブが

大きな競争優位だった

1990年代後半インターネット黎明期に、新しい流れに乗ってWebへの準備が出来ていた企業が急成長できたように、2010年代後半からは”データ”に対して十分な準備ができている企業が今後10年で大きく成長していくであろう。

  • ユーザ獲得のための色々な施策を展開
  • 色々やるけどデータベース構造だけはしっかりキープ
  • 外部サービスとのデータ連携をしっかり
  • Google AnalyticsやFacebook広告など
  • FB広告 / GA / MySQLのデータが分断されているとつらい
  • ユーザ獲得のためのデータサイエンス
  • PDCA → DCAPでサイクルを超早く回す
  • 次のフェーズへの準備を怠らない
  • データがどんどん増えていく

アナリティクスネイティブ

データエクセレンス・カンパニー

変革期

"20 Years Later"

次の形態へのトランスフォーム

このフェーズでフルタイムの

データサイエンティストは必要か?

サービス立上げ期

どこにいるのか?

どうやって探すのか?

”育てる”

そろそろ調理の準備が必要

"アーキテクチャを確立"

  • サービスがプロトタイプ、α版、β版と進化
  • アーキテクチャを固める重要な時期
  • ”分析”&”オペレーション”融合システム
  • 最初からオペレーションへ組み込んでおく
  • モデルのポータビリティ

創業期

"データの構造やデータベースをしっかり作る"

どこまで自前で持つのか?

Tornado

Pythonでの分析結果をそのままWebサービス化

  • データサイエンスの使いどころも意識して、サービスやプロダクトを準備する
  • ”ビッグデータ”、”人工知能”、”IoT”の本質
  • 重要なエンティティに関するデータ項目を洗い出す
  • 顧客やサービス・プロダクト
  • ”CREATE TABLE”はデータサイエンティストがやる

素材がないので、まだ料理できない

データエクセレンス・カンパニーへ!

pickle モジュールは Python オブジェクトの直列化および直列化されたオブジェクトの復元のためのバイナリプロトコルを実装

学習済みモデルのポータビリティ

Scopri di più su come creare presentazioni dinamiche e coinvolgenti con Prezi.