日本データマネージメント・コンソーシアム

会員コラム

【Vol.44】植松幸生氏「魚を釣り、適切なまな板を準備するところから始める寿司屋」――R&D組織ならではのデータ活用


colum_title

JDMC会員による「リレーコラム」。
メンバーの皆さんそれぞれの経験・知見・想いをリレー形式でつなげていきます。
今回、バトンを受け取ったのは、NTTコミュニケーションズの植松幸生さんです。
 

「魚を釣り、適切なまな板を準備するところから始める寿司屋」
――R&D組織ならではのデータ活用

 
「データを活用した意思決定を会社に根付かせる!」をテーマに20名程度のチームで日々データ活用を考え、解析しています。技術開発部という、NTTコミュニケーションズのR&D組織に属し、各サービス部、オペレーション部と連携しながら、組織をまたいだプロジェクトや企業幹部に対し適切なデータ活用・解析が行える人材の育成を目指して活動しています。
 
我々のチームの特徴は「目的を達成する!」ことに特化しているところにあります。通常、データサイエンスの分野では各サービス部などの目的をヒアリングして、今あるデータから、その目的を達成する解析を行ってフィードバックすることが求められます。一方、我々のチームの場合は、(1)目的に必要なデータを自ら収集して、(2)目的に必要な要件の基盤を構築して、(3)今までの解析事例を生かして最終的なアウトプットを出すことに注力しています。
 
幹部向けに解析を提供する場合、「目的だけ」が与えられることがあります。例えば、「最近、ネットワークが遅いらしいから調査してほしい」という依頼があったとします。通常、本当にネットワークが遅いかどうかを設備の帯域情報などを時系列でまとめてレポーティングすることが正解と言えます。それが我々のアプローチでは、「本当に他社と比較して遅いのか?」「お客様は本当に遅いと言っているのか?」といった情報を集めたうえで、どの程度のデータ量になるのかを見積もり、それを捌くための基盤を用意するところから始めます。
 
まず、他社との帯域の違いを比較するために各社の競合他社の回線を契約し、同じ場所から複数の回線で速度を測定し比較します。それも24時間、ほぼすべての都道府県分を収集します。これだけでかなり膨大なデータ量になります。また、本当にお客様が不満を持っているのかを確認するためにSNSやコールセンターのデータなどを収集することまでします。寿司屋に例えると、魚を釣ってくるところから始めるわけです。
 
データを集めた後は、その規模と、想定ユーザーの要件を定義します。例えば、「すべてのデータを30分毎にリアルタイムに更新して、何か異常があった時はメールで通知してほしい」といった具合です。我々はその要件を満たす基盤の構築にかかります。データ量などの要件は案件ごとに変わるので、オープンソースソフトウェアを駆使して、データ規模がテラバイトを超えたらHadoop、少ない量の場合はRDBなどの使い分けをし、要件に合った方式を作ります。もう一度、寿司屋に例えると、今回の魚をさばくのにちょうどいい大きさ・素材のまな板や包丁を準備するところでしょうか。
 
最後にその基盤の上で、バージョン管理システムのgitに登録された今までの解析事例からマッチするものを活用しながら解析します。この場合、異常検知のアルゴリズムなどを活用してプログラムを組むことになります。また、可視化もリアルタイムに可視化するものと、本当に要件にあったものができているかを確認するためのバッチ解析ともうまく連携させてレポーティングしています。
 
このように、我々は一般のデータサイエンスチームとは異なり、魚を釣って(=データを収集して)、まな板を用意して(=基盤を構築して)、研いだ包丁を使って(=データ解析事例を活用して)寿司を握っています。ある意味、R&D組織ならではの構成と言えますが、1つのデータ活用の方法論として参考にしていただければと思っております。
 
 
profile_uematsusan植松 幸生(うえまつ ゆきお)
NTTコミュニケーションズ 技術開発部 データサイエンス&AIユニットリーダ。2003年、日本電信電話に入社後、検索エンジンの開発、分散データストアに関する研究開発に従事、2010年よりNTTコミュニケーションズでレコメンデーションエンジンの開発、2012年、米国大学留学中にクラウドソーシング関連の研究を経て、現職である社内のデータ活用推進、およびその基盤開発に従事。博士(工学)。
 
 
 

RELATED

PAGE TOP