顧客に寄り添うデータ分析の実践〜データ活用の障壁を乗り超える方法とは?~

顧客に寄り添うデータ分析の実践〜データ活用の障壁を乗り超える方法とは?~

こんにちは。株式会社KiZUKAI採用チームです。今回は、KiZUKAIのデータサイエンティスト・徳永輝氏にインタビューをしました。年間10プロジェクト以上に携わる傍ら、毎月複数の分析を行う徳永氏。徳永氏の考える「結論が大きく変わるデータ分析の切り口」「アクションにつながるデータ分析」「顧客体験を高めるためのデータ活用」とは?

インタビューイーについて

株式会社KiZUKAI 徳永輝氏大学院時代、宇宙工学分野で機械学習を用いた研究に携わる。新卒では大手総合電機メーカーに研究員として入社し、機械学習や統計モデルに関する技術を用いた機械製品の故障予測の研究開発に従事。VR系スタートアップでアプリ開発エンジニアを経て、現在はKiZUKAIの解約リスク予測やデータ活用機能の研究開発をリードする。

データ活用の障壁を乗り越える

分析結果に共通する「変数の多さと施策へ繋げることの難しさ」とは?分析結果に共通する「変数の多さと施策へ繋げることの難しさ」とは?

KiZUKAIのプロダクト初期は、機械学習による解約リスク予測やクラスタリングの細かい数値なども、クライアントに共有した方がよいと考えていました。しかし、見るべき数値が多くクライアント目線からは結果が複雑に感じられ、完成したモデルの信憑性が議論の中心になることもありました。結果の詳細を隈なく共有することが「データ活用への障壁」という課題を生んでいたのです。機械学習は、様々な変数の組み合わせから結果を導き出します。他方、人間は1つの指標から結果を導き出すことが多いでしょう。

つまり、AIにとっては当たり前である「複数の変数」に人間は慣れていません。その中でも、私たちデータサイエンティストは、変数を同時にが数十〜数百個考慮することに慣れておりあるものに慣れつつあり、分析者同士では複数の指標を用いた議論は日常的に行われています。

例えば、AIが50個の変数を用いて導き出した答えをクライアントに共有する際には、5個程度のクラスタに集約して説明を行います。「複雑な説明にならないように」というデータサイエンティスト観点での配慮です。しかし、分析に慣れていない人からすると、5個の指標でも難しさを感じてしまい、結果としてクライアントとの議論の中心が「分析内容を解釈すること」になってしまうことも多いです。そこでまずは「見るべき変数を大胆に減らしてアウトプットする」という着想を得て、解釈しやすい簡単な見せ方へと改善しました。すると「施策につなげやすい!」という多くの声をいただけるようになりました。見るべき変数を減らしたことがデータ活用への道を拓いたのです。

複雑なダッシュボード
綺麗なダッシュボード

時系列情報の有無によって、データは全く異なる結果を示す

なぜ時系列情報の重要性に気づいたか?

コンテンツ系サブスクリプションでの事例をご紹介します。あるクライアントの自社分析によると、サービス全体で「コンテンツの消費量の平均値」と「解約率」に相関がないという分析結果が出ていました。平たく言うと「コンテンツを利用した数は、解約者と継続者で変わらない」という仮説が立てられていたのです。しかし、それはデータサイエンティストとしての経験だけでなく、クライアントの直感から値からもは少し違和感を覚えるものでした。コンテンツを活発に利用するユーザーほど、解約しづらいと考えていたからです。そこで、ユーザーごとの継続期間でセグメントを区切ってデータを整理しました。すると、異なる結果が見えてきました。ユーザー全体の平均では解約率と相関がなかったものが、継続期間によってはコンテンツ消費量と解約率に相関があったのです。この事例から、時系列情報を考慮にいれることによって、データは全く異なる結果を示し得ること、つまり「サブスクリプションにおける時系列情報の重要性」に確信を得ました。

データの切り口によって、導き出される結論は大きく変わる

サブスクリプションでは何が重要なのか?

コンテンツ系サブスクリプションでの事例が示すように、データ整形の切り口によって、導き出される結論は大きく変わります。言い換えると「データの切り口から、重大な見落としが起こり得る」ということです。サブスクリプションにおけるデータ活用で重要なことは、前述した通り、時系列情報ですが、これに加えコンテンツに関するデータも欠かせません。サブスクリプションにおける重要な変数は、時系列情報(サービスの利用履歴)とコンテンツ情報です。データ分析においては用いる変数によっては「クライアントの施策に繋げづらい結果が出る」ということも往々にして起こります。例えば、男女や年齢など、施策で変えることのできない変数を分析で使ったときです。もちろん、ユーザー属性を考慮に入れた分析から有用な知見が得られることも多いですが、アクション、つまり施策へとつながるデータ分析を行うには「施策として変えられる変数を使う」も考慮に入れるポイントになってきます。サブスクリプションでは、このような考え方のもとデータ分析を行うことで、初月から契約するケースと無料会員のまま終了するケース(有料化率)や契約ユーザーの解約率の違いが見えてきます。

時系列による分析は、顧客に寄り添う第一歩

データを活用するために必要なことは?

データ活用という観点では、機械学習による複雑なアウトプットが必ずしも有効ではなく、簡単なデータ整理の方が施策につなげやすいケースも見かけます。結果、サービス全体として良いインパクトが出る可能性もあります。質の高いデータ活用に向けて、まず自社で第一に取り組むことはデータを綺麗に残していくことです。次のステップとして「時系列情報」「コンテンツ情報」「ユーザー情報」の3つを掛け合わせて分析を行います。AIによるデータ分析というと、人間が想像もつかないような「施策に関するヒント」が見つかるとイメージしている方も少なくありません。もちろんそういったケースも稀にありますが、多くは当たり前のことが細かく見えてくるというケースです。この当たり前なことを定量的に見ることができるのがデータ分析です。そこから次のアクションへのヒントが見つかり、施策を実行することで、データ活用が実現します。KiZUKAIではデータ分析を通して顧客一人ひとりを見ることが重要だと考えています。時系列による分析は顧客に寄り添う第一歩ではないでしょうか。

日々の分析はクライアントと並走して顧客価値を高めるためのもの

データサイエンティストとして伝えたいこととは?

私たちデータサイエンティストは、データを見慣れてない方へアプローチも忘れてはなりません。ただデータ分析をするだけではなく、データ活用の重要性に気づいていただき、施策につなげられるような答えを導き出し、共有することが大切です。データサイエンティストとして最も重要にしているのは、アクションを実行し、クライアントのサービスが改善につながるデータ分析です。「日々の分析はクライアントと並走して顧客体験価値を高めるためのものである」というのが私の考えです。今後も、サービスをクライアントと一緒により良くしていくことで、顧客ロイヤリティ向上に貢献できれば嬉しいですね。

編集後記

本記事では、KiZUKAIのデータサイエンティスト・徳永輝氏の考える「結論が大きく変わるデータの切り口」「アクションにつながるデータ分析」「顧客体験を高めるためのデータ活用」についてご紹介しました。株式会社KiZUKAIは【サブスクリプションプロバイダー向け LTV/解約率改善ツール KiZUKAI】を提供しています。ユーザーの利用動向や属性情報をインポートするだけで、ヘルススコアと解約リスクを算出し、顧客リストを作成します。散らばるデータ収集を支援、顧客状態を瞬時に可視化。リストを自動抽出しアクションへ導く。顧客ロイヤリティを劇的に向上させるツールです。