【Vol.5】 伊藤光夫氏 「データ利活用環境のあり方、DWH構築について思うこと」


colum_title

メンバーの皆さんそれぞれの経験・知見・想いをリレー形式でつなげていきます。
今回、バトンを受け取ったのは、アグラの伊藤光夫さんです。
 
 

データ利活用環境のあり方、DWH構築について思うこと

 
 
 アグラの伊藤と申します。第5回のコラムを担当させていただくことになりました。お付き合いいただければ幸いです。
 
 諸賢の皆様に向けて何を書いたらよいか悩みましたが、今回は、データマネジメントに係るソリューションベンダーとしての立ち位置から、データ利活用環境のあり方やアプローチについてこれまでの実務経験に基づいて述べさせていただきます。
 
 企業内外には、様々なデータが存在しており、データ利活用の視点から言うと、そのデータの意味の統一化がなされている必要があります。例えば、「売上」と一口に言っても、営業担当者は「受注売上」、財務担当者は「検収売上」、プロジェクト管理者は「進行基準の売上」と解釈している可能性があります。
 
 お客様からお聞きした、こんな話があります。売上高数兆円規模の日本の大手メーカーが、同一業種のアメリカ大手メーカーを買収し、品質管理の観点より不良率比較を行いました。不良率はどちらも1%でしたが、日本メーカーのそれは、工程不良率でラインから出た際の不良率で、アメリカのメーカーのそれは、工程不良となったものを再メンテナンスした後の市場不良率を指していたのです。この違いが買収当初は分からず、2年後に露見したそうです。
 
 市場不良率のような企業用語辞書は、大半の企業が作成・更新していますが、用語内容をデータベースのメタデータレベルで関係付けし、一致させているところはごくわずかではないでしょうか。データを形式知の情報として扱うには、情報システム内の各種データと意味体系付けを明確化し、いつでも意味の明確化を伴う、形式知化した情報として取り出せるITシステムとツールが不可欠となります。
 
 併せて重要なのは、言わずもがなデータ品質です。各種バラバラな既存システムから情報系システムを構築する際に必ず起こる、「各種マスターデータ横串化」(そのために実現しようとするマスター統合)とデータ品質の確保は避けては通れない課題となります。
 
 物理的なマスター統合を指向した際は、必要期間の長さ、コストの肥大化、構築の困難さから、着手に二の足を踏んでいる、もしくは着手したが途中の条件変化や実現スピードの遅さからプロジェクトが頓挫したという声をよく聞きます。市場に揃うMDMソフトウェアにはデータクレンジング機能が備わっていますが、マスターデータの不整合やデータ品質不良の状態を人間が検証・解消して、正しいマスター、正しいデータを設計できてはじめて、その効果を得られるようになります。
 
 また、データ品質の問題は、情報システムを開発・提供した段階で情報システム部門から業務部門に委ねられることになりますが、その品質レベルを業務部門にてチェックする仕組みがないか、あっても有効に機能していないケースを多く見受けます。
 
 データ品質を含め、データ統合自体に責任を持つ部門や業務機能が不明確なまま推移し、企業内においてデータガバナンス、データマネジメント自体が真剣に語られる機会も少なくなっていく――このような現状が今日の課題かと考えます。
 
 さて、ビックデータばやりな昨今、DWHやBIの構築が活発化し、大規模な活用事例も数多く紹介されています。以下、DWH構築手法とデータを情報として形式知化する上でのポイントにも触れておきます。
 
 DWHの構築工程は、基幹系システムの構築と同様にウォーターフォール型の開発フェーズを採られるケースが多いようです。ただし、この方法は往々にして時間がかかりすぎるのと、ユーザー検証が最終工程にあって要件の後戻りなどが発生しやすくなるきらいがあります。では、短期間かつ、ユーザーが十分納得できる形でDWHを構築するにはどうしたらよいでしょうか。
 
 まず、いかに早くユーザーの要件を引き出し、要件を固めて行けるかが問われます。既存システムの既存サンプルデータを使いながら、データ調査・データ変換設計/試行・変換結果確認を同時進行で行うアジャイル的なアプローチが有効と考えます。
 
 2点目は、ユーザーニーズの多様性にこたえるため、データを情報として形式化するための各種情報要素群を整理・登録し、それらをつなぎ合わせるロジックを確保することです。バリューチェーン上で言えば、引き合い、受注(明細)、出荷、請求、保守など、現場が必要とする情報を明確化し登録しておくことになります。
 
 3点目は、上の情報要素群が示す「具体的な企業データ」が何かを、現存の社内外のデータ(ERPや各サブシステムのDB、各個人のPCで扱われるExcelデータなど)と関連付けを行っておく。その上で情報要素の視点から、既存システムに依存せず、簡単に現存のデータを統合し取り出すというやり方です。これは、言い方を変えると、「既存システムはそのままで、データマートを自由自在に設計・開発できる環境の実現を意味します。
 
 ただし、上記を物理のメタデータレベル管理を元に実現することは非常に困難です。そこで、仮想論理モデルに基づく仮想化統合が1つの有効な手立てになると考えます。私達が提供している「AGRA」は、その具現化を支援するツールということになります。
 
 データマネジメントについて、大手企業を含む数多くのお客様と議論させていただく中で、問題の深さ、拡がりの大小はあっても、本質的な課題は近似していると感じています。今回紹介したようなアプローチを組み合わせながら、問題解決にあたらせていただいております。ご質問やご意見、ご相談がありましたら、お気軽にお願いいたします。
 
 

itousan 伊藤 光夫(いとう みつお)

アグラ株式会社 シニアディレクター。

1962年岐阜県生まれ。立教大学卒業後、日本総合研究所、日本オラクル、外資系コンサルティングファーム等を経て2010年8月、アグラ社にジョインし現在に至る。企業のデータマネジメント、情報活用基盤提供等、AGRAソフトウェアのセールス&コンサルティング支援活動を行う。JDMCでの研究会活動については、2012年度から参加。
 
 
 
*~*~*~*~*~*~*~*~*

次回のコラムのバトンを受け取ったのは、黒澤基博さん(データ総研)です。お楽しみに!