超初級データサイエンス研究会レポート: 分析方針の立て方を学ぶ

ITジャーナリスト 鈴木恭子

 

JDMCコミュニティ「超初級データサイエンス研究会(以下、サイエンスの会)」は9月24日、JDMC会員・リアライズ社(木場)会議室をおかりして、コミュニティメンバーを対象にしたハンズオン研修第3回を開催しました。

サイエンスの会は、データサイエンスに興味がある初心者や、日常業務でグラフを使用したレポートを作成している会員企業の従業員を対象とした研修です。2020年はオンラインでの講義が2回、オフラインでのハンズオンが4回の全部で6回プログラムとなっています。実際の小売店舗で収集したデータを基にした分析からはじまり、最後は課題解決となる「打ち手」を考えて発表し、参加者同士で検討するところまで行います。

サイエンスの会でリーダーを務めるデータビークルCEOの油野 達也氏は、「企業向けに半年かけて学んでもらう内容を、エッセンスを絞って『超入門』として紹介する企画です」と説明します。

 

 

テストデータはトライアルの“リアル”データ

 
第3回では「テストデータで分析をすることから リサーチデザインを考える」をテーマに、分析方針を立てる際に留意すべきポイントと、その重要性について学びました。

分析をする際の基本となるのが、「アウトカム」「解析単位」「説明変数」の明確化です。アウトカムとは、利益に直結する成果指標を指します。たとえば、小売りの場合は売上増加や在庫コストの削減などがそれにあたり、最初に定義する必要があります。解析単位は、アウトカムを比較する単位です。具体的には商品・顧客・従業員・店舗などです。

分析によって性別、年齢、購入商品のカテゴリ等の説明変数(要因)が、どのようにアウトカムに影響するのかを探し出し、どうすればアウトカムを達成できるのかを導き出すのです。

ハンズオンでは約15人の参加者が4つのグループに分かれ、ディスカッションをしながら「アウトカム」と「解析単位」を決定し、そのための「説明変数」を見つけるまでのプロセスを学びました。

ちなみに今回利用したテストデータは、JDMC会員企業で、九州地方を中心にスーパーセンターを展開するトライアルカンパニーが提供したID-POS(一部)データです。「参加者がトライアルから依頼されたデータサイエンティストになって、売上向上の施策を提案する」という、いわば、実地訓練です。

 

“打ち手”となる「説明変数」を探す

 
実際にデータと向き合ってみると、「解析単位」と「説明変数」を決めることに苦労します。アウトカムは明確であっても、「どの解析単位に注目」し、「どの原因(説明変数)を改善すればアウトカムを最大化できるのか」が見つかりません。油野氏は「説明変数を探すコツは、変えられる原因を見つけること」と指南します。

「説明変数は“打ち手”の部分です。『天候』や『顧客の平均年収』は変更できませんが、『出荷数を変える』『来店頻度を増やす』といった“打ち手”は工夫次第で変更できます」(油野氏)

あるチームはディスカッションの結果、「アウトカム」を売上げ、「解析単位」を顧客、「説明変数」に1回の買い物の購入点数が含まれるのではと予想しました。購買行動を見ると、1回の来店で購買品数が5品以下という顧客が半数以上を占めていたからです。分析の結果「1回の買い物の購入点数」が説明変数になりえるのであれば、まとめ買いによる値引きや季節もの(限定商品)を充実させるなどの「+1品買い」の“打ち手”を検討することができます。

 

ツール導入を目的化しない

 
油野氏はサイエンスの会を開催する目的を「データマネジメントの裾野を広げることです」と説明します。「日本では3000億円以上の規模で、かつ成熟度が高い企業はデータ分析に投資し、データ分析に基づいた売上向上施策に取組んでいます。しかし、大半の企業はこうした状態にありません」(同氏)。

データ駆動型経営の必要性が指摘されているものの、多くの企業ではBIツールでグラフを作成することに手間をかけたり、顔認証ソリューションなど、最新のAI(人工知能)技術を導入したりすることに終始し、ツールの導入が目的化してしまっています。しかし、データ分析の目的は「何をすれば売上が上がるか」という“打ち手”を見つけ、それを実行して実績を出すことです。

油野氏は、「今回のサイエンスの会では、最後の“打ち手”まで考えていきます。頭と手を使ってビジネスに直結するデータマネジメントを理解してもらいたいからです。これをきっかけに、自社のビジネスでデータ活用を進めてもらうことが重要だと考えています」と説いています。

 

今回は金融、建設、流通など、さまざまな業種の会員が参加しました。ある会員の方は、「日々の業務でデータを扱っていますが、異業種の方とチームを組むと、着眼点が異なって勉強になります」と感想を述べます。サイエンスの会は、データマネジメントに取り組む企業の担当者が“横のネットワーク”を築くうえでも役立っているようです。
 


※ハンズオンの準備サポートをしてくれた、JDMC会員・データビークル社スタッフみなさん。

 

JDMCコミュニティ「超初級データサイエンス研究会」について ;
私達と一緒にデータサイエンスの旅にでかけませんか。本研究会はプログラミング学習をデータサイエンスの本筋とせず、その基礎をビジネスサイドとデータマネジメントサイドから研究していきます。なお、プログラミングを割愛するために分析環境には、JDMC会員のデータビークル社から無償提供されるdataDiverとdataFerryを利用します。※今回の募集集は終了しました。詳細はこちら
https://japan-dmc.org/?p=12418

 

JDMCについて;
2011年4月に設立されたJDMCは、データの管理や利活用の仕組みづくりに必要なガイドラインの提供をはじめ、データ管理の具体的な実践方法などを通じて、データ駆動型ビジネスの土壌づくりを目指す団体です。参加企業はITベンダーをはじめ、金融・小売・流通・通信など幅広く、200社以上の企業・団体が参加しています(2020年9月時点)。

   

鈴木恭子(すずききょうこ)
ITジャーナリスト。週刊誌記者などを経て、2001年IDGジャパンに入社しWindows Server World、Computerworldを担当。2013年6月にITジャーナリストとして独立した。主な専門分野はIoTとセキュリティ