yuwji.hatenablog.jp

雑多に色々

2019/3/7 MixLeapStudy「BIツール:Tableau ジェダイの帰還」に参加した

2019/3/7 MixLeap Study#36「BIツール:Tableau ジェダイの帰還」に参加したのでメモ

yahoo-osaka.connpass.com

はじめに:前提とか

私はSIer所属なのでTableauを「使う」よりは「提案する」立場です。 ただし、「使えないのに提案って何それ」と思うので、学びたい!という動機で参加しました。
既に弊社から購入頂いたユーザー様もいらっしゃいますが、まだマトモに使っておらず、どう展開するのもかも考えないといけない状況なので、広め方を知れると提案力に差が出そうですし。

「Tableauの目指す世界 ~すべての人に、データの力を!~」

山崎さん@Tableau Japan 株式会社

  • Tableau Jedi (ジェダイ)というTableau社が認める「誰もがデータを見て理解できるよう支援する」データ分析のスペシャリスト。
  • 山崎さんはカスタマーサクセスマネージャーという立場
    • この役職からも分かるように、単にツールを売るのではなく、ユーザーを成功に導くために伴走する意思のある・推進している会社
  • 世の中のデータの90%が直近2年で生まれている
    • IotやAmazonGoのようなセンサーデータはめっちゃ多い
  • Tableauでは認識しやすい表現を出来る
    • 長さ・太さ・濃淡・色・ヒートマップ・地図・各種グラフ
    • ビジュアル分析
  • デジタル・デバイド

    デジタルデバイドとは、コンピュータやインターネットなどの情報技術(IT:Information Technology)を利用したり使いこなしたりできる人と、そうでない人の間に生じる、貧富や機会、社会的地位などの格差。個人や集団の間に生じる格差と、地域間や国家間で生じる格差がある。 (IT用語辞典 e-wordsより)

  • シチズンデータサイエンティストを増やす
    • ガートナー
      • Gartner Says More Than 40 Percent of Data Science Tasks Will Be Automated by 2020
      • 原文

        According to Gartner, citizen data scientists can bridge the gap between mainstream self-service analytics by business users and the advanced analytics techniques of data scientists. They are now able to perform sophisticated analysis that would previously have required more expertise, enabling them to deliver advanced analytics without having the skills that characterize data scientists.

      • Google翻訳+ちょっと修正

        Gartnerによると、シチズンデータサイエンティストは 、ビジネスユーザーによる主流のセルフサービス分析とデータサイエンティストの高度な分析技術との間のギャップを埋めることができます。彼らは今では「より専門的な知識を必要としていた高度な分析」を実行できるようになり、データサイエンティストを特徴付けるスキルを持たずに高度な分析を提供できるようになりました。

    • 現状の構図・分布
    • 目指す姿
      • 極少数の「データサイエンティスト」
      • 大多数の「シチズンデータサイエンティスト」
  • Tableauによる分析スタイル
    • 仮設を立てて分析指標を変えて確認する流れをリアルタイムで出来る
  • 年4回以上バージョンアップ

Yahoo! JAPAN流 Tableau推進のコツ」

平林さん@ヤフー株式会社

*Tableauではなく、別のツールでも使える推進(広げ方)のコツとのこと
確かにそうでした!

Tableau以前のスタイルと課題、対策

これまでは、データ分析プロセス(検知→分析→実行→評価のループ)のそれぞれに適した内製ソリューションで提供していた。
ここで課題として、下記が出てきた。

  • ニーズの多様化・高度化
  • 各プロセスに特化したツールの為、繋げられない
  • 総じて、100あるサービスに答えるのが難しい

そこで、データ分析のセルフサービス化を始めた。

なぜTableauを選んだのか?

  • 職種や個人のスキルを問わずに使える
    • D&Dによる操作性
    • R,Pythonと繋げられる
  • 組織風土にマッチした
    • 流動的な組織のため、引き継ぎやすさが重要
      • ヤフーさんは「ヤフーの1on1」(書籍)で、メンバーの志向性とか適正、異動希望もキャッチアップしているので、余計に流動的なんだろう。
    • API,SDKが豊富でカスタマイズしやすい

推進体制

  • Tableau CoE(Center of Excellence)
    • Tableau Server
    • サーバー管理者
      • 保守・管理・ハンズオンセミナー・コンサル、等
  • 利用部門
    • サイト
    • サイト管理者
      • データソース提供など。

コツ1:熱量のある人を見つける

既存業務を効率化するモチベーションの強い人に向けて、課題を解決することで、新しいチャレンジをするお膳立てをしてあげる

コツ2:ビジネス・組織体制を理解する

企画担当からエンジニアに依頼し、エンジニアがデータ抽出していた。 しかし、エンジニアがフォーカスすべき本来のミッションは開発なので、齟齬が生じていた。
企画担当が直接データ抽出できるようにすることで、エンジニアの負担を減らし、データ抽出を早くできるようにした。

これは、利用環境等のコンテキストを理解し、それに合った解決方法を模索して出来たこと。

そうすることで味方を増やしていった。

コツ3:ルーチンに組み込む

KPIのダッシュボードなど、ルーチンに組み込むことで、データを見る習慣を根付かせた。

コツ4:アウトプットにこだわる

  • データを見るモチベーションが高い層は少人数。
    • シンプルなビジュアルで良い。
  • データを見るモチベーションが低い層は大多数。
    • 見たい・触りたいと思えるビジュアルにする
    • UX大事!

コツ5:コミュニティを作る

成功体験・ノウハウを共有できる場を作る。
それにほり、プロセスが回るようになる。
成功体験を創出し、広がると、FUNが広がる。

「データ分析ツールを内製からTableauに移管した話」

田村さん@ヤフー株式会社

データ分析ツールを内製している場合に難しいところ

  • 業務/目的の異なる人全員にパーフェクトなソリューションを提供するのは無理
  • あっち立てればこっち立たず状態
  • どちらも立てるために機能追加し続けると複雑化し、運用コストが増える。
  • 個別最適で内製しても、全体としては運用コストが増える

どういう構造にしたか

  • データストレージへの登録は、ETLを使う
  • ツールで自動化するのであれば、作業を巻き取る(引き受ける)ことができる
  • メールでのレポートは殆ど見ていなかったので廃止。
    • 人力で集計してた
    • 必要ならSQLを渡す
  • apache+phpによる構成をTableauサーバーに変更
    • 開発・運用コスト激減
    • マネジメント層向けexcelレポートもTableauに組み込む。(自動更新される)

つまり、

  • 利用者自身が自分でカスタマイズできる
  • 自分でデータを見てもらう
  • ETLとTableauサーバーで管理コストゼロ!
    • ホンマにゼロなんかな??

教訓として

  • まずは業務の棚卸し
    • 先のメールのように本当は不要だったり、必要性の低い、代替出来るものがある。
  • センシティブな情報を除き、生データは積極的に公開する。
    • 性善説の方が圧倒的に低コスト
      • これは色んな業務でも言えることだと思う。交通費精算とか。
      • クレジットカードを渡してる会社もあったはず。(Googleだったっけ?)
  • 責任範囲を広げた方が良いこともある

データ分析プロジェクトの進め方

これまでは、「要件決め」→「DB開発」→「FE開発」
Tableauでは、「要件決め」→「TableauWorkBook作成」→「DB開発」
つまり、Tableauで見たいデータに合わせてDBを開発する。

「BigData BI in Rakuten」

浅井さん@楽天株式会社

めっちゃハイスピードで話されていたので、一部すっ飛ばしてそう…

なぜやったのか

ECコンサルタント(店舗様向け営業)の

  • 提案準備時間の差苦言
  • コンサルテーションの質(提案力)の向上

*ECコンサルタントは、全国に500名程度いる。

体制

PJメンバー → エバンジェリスト(複数) → メンバー

導入方針

  • ExcelをTableauへ
  • 利用頻度の高い、ルーチンを置き換える
  • データマートは統一
    • 目的毎にデータマートを作ると、開発依存になり、管理が煩雑になるので。
  • 20PBものデータ量

構成

  • Storageに「hadoop
  • Analyze Engineに「atscale」 を使った

atscaleはML?がよく使われるデータ分析に合わせてデータキューブを作ってくれる。 これにより秒で描画出来るようになった。

取り組み

で、どうなった?

  • 定着し、ECコンサルタント自身で分析し、ビューを作るようになった。
    • 1年でビューは1000を超えた
  • 店舗様アンケートで過去最高に!

Tableau Public

Tableau Publicというビューを共有できるサービスがある。 (GitHubとかDockerHub的な感じかな?)
そこで色んなビューを見ると勉強になるし、楽しい。
オススメの人は「Yoshihito Kimura」さんと「Yukari Nagata」さん

所感

導入施策として、下記がええ感じやなぁという印象を得ました。

  • 現場のリーダー(サイト管理者・エバ)を任命する
  • ユーザー自身でデータ抽出できるようにする
    • 出来るだけ性善説
    • 一般的大企業病だとマネジメント層からの反対がキツそうやけど。
  • 多くの人がそれぞれビューを作れば、より良い物を作り出せそう。
  • ルーチンに組み込むのは鉄板っぽい
  • UXも大事!!

あと、今回ノートPCを持って行くのを忘れてしまったので、初めて紙にメモるスタイルにしてみたんですが、コレが結構良かったです。 一長一短なので、自分にもコミュニティにもベストなやり方を探らんとー。

以上です。