本記事では、昨年に「docks」で行われた「creww academy vol.06〜スタートアップにおけるデータ分析チームの立ち上げ方〜」の内容をダイジェストでお届けします。
※この記事は、2018年10月17日、creww magagineにて公開された記事を転載しています。
今回のイベントの来場者は男性が多めの印象でしたが、和やかな雰囲気でスタートしました。
本日登壇いただいたのは3名。AnyPay株式会社の中澤公貴氏、株式会社Moffの河治寿都氏、Ambedkar合同会社の冨田直行氏です。

では、それぞれどんな面でデータ解析を活用しているのでしょうか。
AnyPay株式会社は、paymo(ペイモ)というCtoCの割り勘サービスを提供しています。割り勘をするためにはレシートのアップロードが必要で、そのレシートをデータ解析を使って“レシートかそうでないか”を判別しているとのこと。他にも、paymo biz(ペイモビズ)というBtoCの決済サービスや、ICOコンサルティング事業を行なっており、離反モデルや不正取引チェックの半自動化など様々な業務にデータ解析が活用されています。
株式会社Moffは、IoTデバイスやウェアラブル端末を活用したヘルスケアサービスを提供。足や腕にデバイスを取り付け、どういった運動をすればどのように治癒改善されるのかを、データとして保存し、病院や研究機関と連携して、データを解析しています。
Ambedkar合同会社は、製造業向けにディープラーニングのソリューションを提供しています。具体的には、ゴミ焼却炉の運転を半自動化することに取り組んでいるとのこと。また、検査機メーカーと一緒に、AIを導入して精度を高める開発も行っています。
ここからは、冨田氏が司会を務め、パネルディスカッション形式にて進行されましたので、お題に沿ってご紹介していきます。
「データ分析」とはなにか

冨田直行氏(以下、冨田)「まずお二人にお聞きしたいのですが、データ分析とは何でしょうか?」
中澤公貴氏(以下、中澤)「2つあって、まず何か対象のものを最適化すること。また、アウトプットも大切ですが、『なぜそのアウトプットが出てきたか』というプロセスを知りたいというのが、経営層の方に多いと思うんですけど、それが2つ目の中身を可視化することで、分析の醍醐味だと思っています。」
河治寿都氏(以下、河治)「非常にむずかしい質問ですよね。個人として思うのは、データ分析といっても、やっていることは単純に数字化することと、人が見てわかりやすくすることで、それ以上でもそれ以下でもないかなと思います。データを用いて解決します!という売り込みは多いですが、解決するためには意思決定が必要ですよね。そのための支援ができるのが、データ分析かなと思います。」
冨田「私も答えたいと思います。河治さんは意思決定にはあまり使えないとおっしゃってましたが、私の会社は自動化を売りにしていまして。画像分野においては、人の手が入っている部分に関しては、ほとんど半自動化ができると思っています。データを生かして半自動化させるところまで、人の領域まで踏み込んでやっていくというのが、いまデータ分析のフェーズにあるのではないかな思います。」
それぞれの企業に「データ分析チーム」が組織された経緯
冨田「中澤さんに伺いたいのですが、データ分析チームが作られた経緯を教えてください。」
中澤「当時の社長の木村と話をしていて、『データを使ってより細かくKPIを管理したい』『データドリブンな事業運営をしたい』というニーズがよく伝わりました。トップマネジメントがデータを使ってビジネスを大きくしたいと思っていたことが理由として大きかったです。」
冨田「ひとつ質問なんですが、木村さんが観測したいKPIというのは、具体的に何なのでしょうか。」
中澤「色々なKPIを見ていると思いますが、例えばよく話に上がるのはROIですね。どれだけの時間を使って、どれだけの売り上げ(や流通量など)をあげるか・コストを下げるか。私も案件全てにROIをつけて、1番インパクトの高そうな案件から実行するようにしています。」
冨田「ちなみにですが、今までに実施された中で『これはいいぞ』と思った分析事例などがあったら教えてください。」
中澤「言えるところでいうと、例えばレシートのアルゴリズムですね。元々はレシートの判別を外注していてコストが発生していたんです。今は業者を使わず社内で行えるくらい精度が上がってきたので、コストを下げるという面での一例なのかなと思います。」
冨田「ありがとうございます。では、続いて河治さん。株式会社Moffでデータ分析チームが組成された経緯を教えてください。」
河治「データ分析チームが2つありまして、1つはサービスの利用満足度をとっているところです。私たちは利用満足度が1番大切だと考えていて、これが無ければ長く続くサービスにはならないと思っているので、このようなチームが発足しました。満足度向上のために数値化し、データを利用しています。」
冨田「サービス満足度はどのように計測しているのですか?」
河治「基本的には、利用の回数ですね。
そして、もう1つが、研究データを解析するチームです。私たちは「どのような運動をすると、どのように治癒改善されるのか」というデータを解析して研究しています。こういった内容については、実は病院関係者もやりたいと考えているけれど、デバイスの値段や導入・運用までのコスト高いといったハードルがあり、簡単なソリューションを探すのが大変という声を聞くんですね。
そこで、我々が比較的安価で提供できるサービスを作り、かつサービスを利用するためのコンサルティングも少し受けているというわけなのです。利用結果や研究結果を積み重ねていけば、Moffバンドというデバイスを用いてヘルスケアに効果的なサービスになるだろうという狙いがありました。」「データ分析」における苦労とは?
冨田「データ分析に苦労はつきものだと思いますが、今までにどんな苦労がありましたか?また、その乗り越え方も教えてください。」
中澤「データ分析で1番苦労することは、『データがないこと』ですね。
今の会社だと、「データをどのように上手く使っていくか」というデータ戦略から入っていけるので、そこはスタートアップのメリットだと思います。なので、例えば機械学習のアルゴリズムを作りたいからこういうデータをとっていかなければいけないよね、ということは考えられます。
ただ、前職のときに感じたのが、レガシーのデータベースが使われていたのですが、データを作ったときには『データサイエンス』という言葉はなく、一般的な手法に則ってデータを格納しているという状態で。それを見ると、ラベル(目的変数)がない場合が多くて、ラベルがないと例えば教師あり学習が使えないので、データを作るのか、外部から引っ張って来るのか、または教師なしなど他の方法を考えなくてはいけないのが1番苦労しますね。」
冨田「他にはありますか?」
中澤「もうひとつ、日々苦労しているのは、プロジェクトのプライオリティのつけ方ですね。色々な案件が入ってくるので、偏りが出てくることがあります。1つの部署の案件ばかりやっていると、他の部署の人とのコミニュケーションが少なくなり、他部署からの案件が降ってこなくなる可能性もあるんですね。なので、私は隔週で各部署と1on1をやっています。ただこの時間は相手の人の時間も使ってしまっているので最小限に留めるように心がけていますけど」

冨田「ありがとうございます。では、河治さんお願いします。」
河治「1つは、データはあるけれど、分析としては使える形になっていないこと。もう1つは、周りに理解者がいないこと。この2つが、自分の中で1番苦労を感じました。」
冨田「データはあるけど分析できる形になっていないというのは、具体的にどういった形なんですか?」
河治「例えばですが、『分析できる形』という定義は様々かと思いますが、数字に置き換えられていたり、ある程度カテゴライズされていたり、といった形になっていますよね。それがそもそも形にすらなっていなくて、データとして面白そうなものが溜まっていると思いきや、蓋を開けてみると全然扱えるものがなく、まずはこれを綺麗にすることからはじめなくてはいけない……というところが、ハードルを感じてしまいます。それで時間を取られて、本質的なやりたいことが遅れてしまうので、苦労しました。」
冨田「理解者についてはどうでしょうか?」
河治「理解者についてですが、当たり前ですけどデータサイエンスの知見がない前提で、基本的に経営層へ最終的な数字の報告をすると思うのですが、パラメーターが……などという話は理解してもらえないですよね。そこをどうやって伝えるかは、頭を捻るところでした。」
冨田「例えば、専門用語を伝えるときには、簡単に置き換えるのか、わかってもらうまで説明するのか、どちらですか?」
河治「前者ですね。」
冨田「ありがとうございます。
私のケースでいうと、コンサルティング会社にいたときには、ナショナルクライアントさんとお付き合いしていました。例えば、電力会社などのお堅いインフラ会社だと、そもそもデータを社外に出せないということもありました。社内政治が働いてしまうんですね。半年、10カ月、1年待ってもデータが出てこないことが多々ありました。なので、そこはリスクとして常に考えていかなければいけないなと思います。」
データ収集・解析・活用のトレンド
冨田「続いては、データ収集・解析・活用のトレンドについてお聞きしていきたいと思います。今のトレンドというか、AnyPay株式会社ではどのような形で収集・解析・活用しているか教えてください。」
中澤「弊社というか、データサイエンス領域で、いま主に使えるアルゴリズムは、大体2つに集約されてきているのかなと思っています。1つ目はディープラーニング系のアルゴリズムです。画像用だったり時系列用のアルゴリズムなどがあります。ただし、決まった形を取り扱うのは得意ですが、テーブルデータなどの決まっていない形のデータを取り扱うのには向かないことも。その場合には、ツリー系のアルゴリズムを使っています。今はこの2つに集約されてきていると感じます。ほとんどの場合どちらかのアルゴリズムですね。」
冨田「このようなトレンドは、経営層の人は理解しておいた方がいいのでしょうか?」
中澤「ケースバイケースですが、ほとんどの場合知らなくていいです。経営層の人は、成果や結果を1番気にしていて、どのアルゴリズムを使っているのかに関心がない場合が多いんですね。ただ、なぜそういう結果になるのか、には関心があります。先ほど、『どのようにレポーティングするかがむずかしい』という話があったと思うんですが、それはその通りだと思います、なぜなら何年も勉強してやっと理解できる高度な数学のコンセプトを簡潔に伝えないといけないのですから。なので私は数学をできるだけ使わずにコンセプトの概要だけを経営層には説明して理解してもらうことに注力します。」
冨田「河治さんはいかがですか?」
河治「中澤さんからはアルゴリズムの話があったので、私はツールの話をしていきたいと思います。スタートアップで大変な面は予算ですよね。データ分析をするための予算が限られているので、結果としてツールが限られてきます。安い中でも一番使いやすかったのはtableauだったかなと思います。tableauは操作の直感性が高いので、使い勝手がいいんですよね。」
冨田「河治さんの会社で使っているツールはtableauのみですか?」
河治「ツールはtableauですね。あとは、システムでいうとamazonが出したAWSとGoogleクラウドプラットフォームを併用しています。」
冨田「中澤さんはどのようなツールを使っていますか?」
中澤「基本的には、お金を使わずにオープンソースのツールを使っています。例えば、、Airbnbがオープンソースのツールとして出しているAirflowというアルゴリズムの実行などを管理するライブラリーがあります。」
冨田「なるほど。ありがとうございました。」
データ分析チームを作るときの心構えとは

冨田「データ分析チームを作るときの心構えを教えてください。」
河治「私がデータ分析チームの立ち上げをしたときは、データを理解してくれる人が1人もいなかったので……、まずは強い気持ちが大切ですね。何をしているのかわからない、と不平不満を言われやすい立ち位置になりがちですし、実際に伝え方次第で変わってしまうので、それにめげないことが1つあるかなと思いました。
また、現在はメンバーから分析結果をもらうようにしているのですが、基本は数字ベースで考えるので、やったことに対しては1回定量的に評価することを意識しています。間違っているかもしれないけれど、一度走らせてみるんです。というのも、私が採用しているメンバーはビギナーからスタートする人が前提なので、基本的にはまず認めてあげて、「こうしたらもっとよくなる」という部分は伝えます。評価が低いとか下げるということは絶対言わないことを意識しています。」
冨田「ありがとうございます。中澤さんはいかがですか?」
中澤「データ分析チームを立ち上げる際に、私はアメリカでよく使われている方法を採用しました。この立ち上げ方はある程度デフォルト化してきています。
まず、トップマネジメントがちゃんと『データドリブンもしくはAIドリブンな企業を作りたい』ということに同意している状態であること。そのあとに、データ分析の責任者の採用、または他部署から連れてきます。そこから、クロスファンクショナルな企業を作っていかなければいけません。クロスファンクショナルな企業とは、マーケティングチームやCSといった他部署と、横串を刺したようなところにデータ分析チームが存在する企業のこと。そして、見落とされがちなのが、データエンジニアを早い段階で採用することです。」
冨田「データサイエンティストとの違いはなんですか?」
中澤「データサイエンティストは基本的には分析を行う人で、データエンジニアは分析するための基盤を作る人のことです。データエンジニアを採用したあとは、ディープラーニングの専門家など、企業のニーズに応じた専門家を採用していく。このようなプロセスで立ち上げていきます。」
冨田「心構えは何かありますか?」
中澤「心構えとしては、やはりちゃんと売り上げもしくはコストにインパクトを出すことです。日本で、データサイエンスを使って莫大な売り上げを達成した、といった大きな成功事例はまだアメリカや中国に比べると少ないと思うんですよね。例えば、amazonのレコメンデーションエンジンは、売り上げの30%を占めていると言われているのですが、このような事例がまだまだ日本では少ないので、こういった事例を作りたいと思って私は日本に帰ってきています。」
冨田「ありがとうございました。」

では、どんな人をデータサイエンティストとして採用するのがいいのでしょうか。
この問いには、「プロダクトがよくなれば会社として業績がよくなるため、プロダクトを中心に考えられる人であることは前提。その上で、コミット力が高い人がいいのではないか(河治氏)」という意見をいただきました。
また、「趣味レベルでデータ分析が好きである人であること。また、見落とされがちですが、英語が読めることも重要です。アメリカや中国が進んでいる分野なので、最初に情報が流れるのは英語が多いですし、学会は英語が基本。データサイエンティストとしての基礎的な素養として大切だと思う(中澤)」との意見も。
データ分析チームを立ち上げるために意識すべきことだけでなく、データ分析での苦労と乗り越え方等もお話いただけた、濃密なイベントになりました。

INNOVATIVE PORT" is an open innovation media operated by Creww, Inc. that connects startups, entrepreneurs, entrepreneurs in recovery, and companies aiming to create new businesses on the theme of social issues.