【Vol.65】日本マイクロソフト 畠山大有さん、アプリとデータの双方をつなげてビジネスの世界でのデータ活用をもっと楽しく!

colum_title
 

JDMC会員による「リレーコラム」。
メンバーの皆さんそれぞれの経験・知見・想いをリレー形式でつなげていきます。
今回、バトンを受け取ったのは、日本マイクロソフト株式会社の畠山大有さんです。

 

アプリとデータの双方をつなげて
ビジネスの世界でのデータ活用をもっと楽しく!

 

このたびJDMCに参加させていただくことになりました、マイクロソフトの畠山です。ふだんはフィールドエンジニアとして、各種のプロジェクトに参画しています。また、そこで得た知見をカンファレンスなどのセッションで皆さんにお話ししたり、ハンズオンやハッカソンのファシリテーションを通じて伝える活動も行っています。今回は「アプリ」と「データ」の違いについて、改めて考えてみたいと思います。

 

「AIの民主化」で、アプリ一筋からデータと密接に関わる日々に

私は日本マイクロソフトに入社する以前は、独立系SIerで金融や流通などのアプリ開発に携わってきました。技術的には、クライアントサーバー型や初期のWeb-DBシステムなどの時代です。当時は一貫してデベロッパーでしたので、常に「アプリ」の世界にいました。具体的に言うと、業務要件を定義してそれを実装に落とし込むという世界ですね。

マイクロソフト入社後はサポートやプリセールス、マーケティングなどの幅広い業務を担当しましたが、ここでもそれらの仕事を通じてアプリとインフラ、そして両者のコラボレーションの世界も体験しました。にもかかわらず、「データ」の世界とはまったく縁がありませんでした。OracleやSQL Serverなどのインフラ構築やチューニングは手がけたことがありましたが、その中のデータには関わる機会がなかったのです。

しかしその後の「AIの民主化」が、私のデータへの関わり方を大きく変えました。仕事のフィールドで既存のモデルを用いたり、必要とあらば自身でモデルを作成したり、常にデータと向き合い活用する日々になったのです。データが無いと何もできない世界に踏み込み、最初のうちはアプローチの違いにとまどいましたが、同時に大きな楽しさも感じていました。たとえばモデル作成前に統計的にデータを見る機会が増えたことで、「あれ、これまでの自分とは思考回路が違ってきているな」と感じるようになったのです。

 

業務要件(ルール)に沿って機能を実装する=アプリ開発は演繹的な世界

ここで「アプリ」と「データ」の違いについて、改めて詳しく見ていきましょう。

まず一般にアプリケーションの構築では、「業務要件を、いかに効率的に自動化していくか?」に主眼が置かれます。変化の激しい時代にあって、業務要件の変化は以前よりもはるかに速くなっています。そのため、「捨てやすいインフラ」としてのクラウドや、小さく実装とリリースを繰り返すアジャイルの手法を用いた開発が多くなってきました。もちろんこの開発過程でもエンジニアはデータを扱いますが、その内容にまで立ち入ることは、ほぼありません。扱うデータ型や容量、鮮度を気にする程度です。

ビッグデータ系のETL/ELT*とても同様です。データは System of Record (SoR)、 つまり事象の記録として価値を持ちます。その実装は「演繹的」です。上でも触れたように、ルール(業務要件)をシステムに実装して、自動化を実現させる点に、アプリケーションの価値があります。

つまり膨大なデータを、対象となる事象(世の中のさまざまなものごとや事実)から一定のルールに従って収集・編集して、利用目的に最適化された形でデータベースに格納する。またそれらを必要に応じて引き出し、使いやすく加工する。これらの一連のプロセスを自動的に行い、ビジネスや研究開発などの効率をアップし、そこから導き出される結果の精度を上げる。言い換えれば、データを起点に、その利用目的に向けて効率よく進んでゆく(演繹)仕組みを開発するのがアプリ開発だと言えば、イメージを描いていただけるでしょうか。

* ETL/ELT= 「Extract(抽出) Transform(変換) Load(書き出し)/Extract(抽出) Load(書き出し)Transform(変換)」

 

得られたデータから未知の事実を見つけ出す=データ分析は帰納法の世界

一方、データ分析の世界は、アプリ開発とは大きく異なります。分析ではデータの内容にも立ち入りますが、それ以上に特定の一件のデータを扱うよりも、全体や特定集団を見る統計の視点が必要です。そして、その統計値をもとに変化や分散、相関などを算出する根拠は極めて「帰納的」です。「事実としてのデータがなぜそうなっているのか?」、「ある事象に対して入力したデータがすべてなのか?」……、これらを事前に正確に知ることは常に困難です。

たとえばある商品が売れない原因を探るときに、最初から分析に必要なすべてのデータをそろえるのは不可能です。たいがいのデータ分析では、分析後に「あのデータが足りない!」となるのが常で、そこからまた追加の新しいデータを集めて再度チャレンジです。アプリ開発のように、要件をすべて確実にそろえて、明確なルールに従って進められる世界とは正反対です。

データ分析は、一度実行したからといって期待する結果が得られるとは限りません。分析に用いる仮説やアルゴリズムが合っている保証はどこにもないからです。System of Engagement (SoE) の世界では、とにかく一度テストしてみて、どうもこれは違うとなれば、またいろいろ考えて……の繰り返し(帰納的)なのです。アプリ開発はあらかじめ目標も正解も見えていますが、こちらはまったく新しい未知の何かを発見しようとする科学者たちのアプローチに近い。まさに「サイエンス」そのものと言ってもよいでしょう。

ちなみにデータの世界では、しばしば「脚気(かっけ)」の逸話が語られます。これは明治時代、旧日本軍を悩ませた脚気の原因を究明する際に、陸軍と海軍の軍医の間で激しい論争が起こりました。この結果、患者数などのデータをもとに研究を進めた海軍が、最終的にビタミン B1の欠乏が原因という「正解=発見」にたどり着くことができた。統計データを用いて事実を明らかにする手法の重要さを示唆するエピソードです。

 

アプリとデータの双方を知ればビジネスへのデータ活用がさらに拡がる

インターネットコマースなどのWebの拡がりは、生産者と消費者を近づける機会を作ってくれました。その結果としてSoEに注目が集まったのですが、実際にそれを業務のコアにできている組織は多くありません。データサイエンスは、SoEのエンジニアリングの中でまだまだマイノリティだと思います。

その理由の1つが、上でご紹介した2つの世界の違いを知らないことなのではないでしょうか。また、SoRの世界にハードウェアなどの品質管理のアプローチを持ち込んで、そこにばかり焦点が集まっているからではないでしょうか。もしくは、データあるいはSoEに必要以上に価値を期待する結果、肝心の実装であるアプリをないがしろにしていないでしょうか。ビジネスの世界にデータ活用を取り込み、確実な成果を得ようとするならば、アプリとデータ分析の双方を理解し、必要に応じて行き来できる仕組みを構築することが必要です。

私がフィールドエンジニアリングの世界に飛び込んで20年以上たちますが、今もこの仕事の楽しさは変わりません。なぜなら、新しいビジネスモデルや新しい社会的チャレンジが日々の取り組みの中から出てくるからです。つい最近も、遠隔医療や農業・漁業・林業などでのIT活用といったテーマが登場し、私をワクワクさせてくれています。今後もその双方の世界を旅しつつ、データに関してはJDMCの皆さんと活発な議論を交わしながら、さらに楽しい世界を共有できたらと願っています。

 

畠山 大有(はたけやま・だいゆう)

日本マイクロソフト株式会社 カスタマーサクセス事業本部 データ&クラウドAI アーキテクト統括本部 クラウドソリューションアーキテクト

最新技術を必要とするお客様への技術的な支援を担当。最新技術とその具体的なビジネスでの活用や、より効果的に使うための情報を提供するべく、イベント・セミナー等にも積極的に登壇している。コンテンツ(動画、Search含む)関連、ビッグデータ、AI/マシンラーニング、Botアプリ関連を得意とする。