(報告)MDMとデータガバナンス研究会#5 ~(1) MDMソリューション、(2) ESGに対するデータガバナンスの導入意義とは

月1回、プレミアムフライデーに開催しているMDMとデータガバナンス研究会。2021年10月29日に開催された5回目は、NTTコム オンライン・マーケティング・ソリューション エバンジェリストの水谷哲氏による「TIBCO EBX MDMソリューションの紹介」、伊阪コンサルティング事務所の伊阪哲雄氏による「ESG(Environment、Social, Governance)に対するDG(データガバナンス)導入意義の考察」という2つの発表が行われた。その概要を紹介する。

 

■マスターデータとは何か。

まずは水谷氏による「TIBCO EBX」というマスターデータ管理ソリューションの発表が行われた。発表内容は以下の通り。

TIBCO Software Inc.はフランス発の大規模なデータ連携ソリューションを提供しているIT企業です。特にSOA(Service Oriented Architecture)やESB(Enterprise Service Bus)という考え方を踏襲し、リアルタイム連携を得意としており、クラウドやAPI連携などを一番の売りにしています。

ソリューションについて説明する前に、まずはMDMの概論について説明します。マスターデータとは「ファクトをデータで表すための語彙を定型化したもの」です。語彙とは、誰が何を、いつ、どこで、どんな方法や理由、いわゆる5W1Hを表したもの。定型化するのは、1回決めたら使い回すためです。定型化されていなければマスターデータではなく、マスターデータ候補となります。ファクトそのものを表すのはトランザクションデータと呼ばれます。トランザクションデータは、誰が、何を、何時に、どこにというようにマスターデータが多数含んでいます。だからマスターデータは大事なのです。

リファレンスデータやメタデータなどはマスターデータの仲間だと私は捉えています。それはDAMA DMBOKを読めばわかると思います。リファレンスデータとは、他のデータの分類用のデータです。例えば「のぞみ〇〇号」という新幹線の号機もリファレンスデータですし、1号車から16号車までの座席データもリファレンスデータです。リファレンスデータは網羅していることが特徴です。一方のメタデータは、データに関する情報、5W1Hを持ったデータです。これらの仲間のデータも、EBXではマスターデータと同様に維持管理を行うことができます。

 

■マスターデータ管理がなぜ、重要なのか

ではMDM、マスターデータ管理とは何か。マスターデーター管理とは、マスターデータを適切な状態に維持することです。具体的にいうと3つの要素があります。1つ目はシステムや場所、組織のサイロを超えて整合を取ること。2つ目はデータそれぞれにデータ品質の基準を持っていること。もちろんデータごとに目的が異なるので、実際の品質基準も異なります。例えば小数点第何位までとるのかも、データの用途によって異なるでしょう。ですが大事なのはデータの品質。きちんと基準があり、それをクリアしていることが重要です。3つ目がビジネス、IT両面での環境変化に対応することです。例えば自然現象やテクノロジーの進歩によりシステムが増えることもあります。また他社とのデータ流通が増えたり、中には買収したり・されたりということもあるでしょう。昔みたいにデータを統合すれば良いというワケにはいきません。変化の激しい今、データを1本にまとめている間に、次のシステムに変わっている可能性があるからです。そこでバラバラでありながらも統制の取れている仕組みが必要になります。それをITの力で実現するのがMDMです。

ではなぜマスターデータを整えることが重要なのか。マスターデータは先述したように語彙を定型化したものです。どの文章でもすべての語彙が整っていれば、誤解が生まれる余地はあまりありません。これはデータでも同じです。つまり語彙を整えることが誤解防止の最短コースになるからです。またマスターデータはシステム領域ですが、業務部門が理解でき、主体になれるデータです。業務をちゃんと遂行している人であれば、プログラムの知識がなくてもマスターデータがわからないということはありません。マスターデータは業務上の必須知識です。そして第三にトランザクションとは異なり、他の部門がチェックや修正を分担することができること。MDMであれば、業務部門がお互いに連携し合って、顧客や品目という軸でデータを集約する仕組みを作ることができます。

これを図にすると次のようになります。製品マスターと書かれているドラム缶のところに、帳票のようなマークが並び、その間に「+」マークが記されています。これが分業です。これを観ればわかるようにこの製品はいつどうやって企画され、どういう図面で、どんな部品、どんな値段で、売り出した後の表かなど、すべての情報を1カ所に集めて一元的に管理をする。また品番やBOMは製造技術、部品の価格などは調達、チャネルや風評についてはマーケティングがアップデートしていく。またMDMには支援機能として、データモデルバリデーションや名寄せ、ワークフロー、ユーザー権限管理、過去マスター管理などが用意されており、予算や販売計画、製造計画、調達計画などへの活用が容易にできるようになります。

 

■MDMが提供する機能と適用分野

MDMソリューションは3階層の業務レイヤーで構成されます。第1層はDI(Data Integration)。基盤を活用したデータ流通は部です。EA(エンタープライズアーキテクチャー)で言うAA(アプリケーションアーキテクチャ)層、TA(テクノロジーアーキテクチャ)層の差異を自動吸収。ESB、ETL、EAIなど現代テクノロジーを活用しています。この基盤がないとMDMとは言えません。第2層はDQ層。DRAGON QUESTではなく、Data Quality、正しいデータしか届けないという保証をする仕組みです。そして第3層がMDM。マスターを一本化せずに共存するための紐付けを行います。例えば10種類のマスターがあったときに、掛け合わせると非常に多くの組み合わせとなります。そうではなく、MDMに持ってくることで掛け算ではなく、足し算のインタフェースですむようになる。これはデータ連携でも業務部門のすり合わせでもそう。1つずつすりあわせたら、非常な労力がかかりますが、全社標準を決めてそこに寄せたものから吐き出すようにすれば、効率的になります。

 

MDMソリューションのシステム機能も3階層で表すことができます。第1層のDIでデータ連携を実施。第2層のDQではデータチェックとルール変更管理を行います。チェックやルールをいちいち書いていたら、手組みと変わりません。自動でチェックし、KPIを出します。第3層のMDMでは、ゴールデンマスター+クロスリファレンスを実現します。ゴールデンマスターとゴールデンマスターマスターのフルセット。クロスリファレンスは例えば本当は水谷さんだけど、他のマスターには木谷さんと登録されているような場合に、同一人物だと紐付けること。クロスリファレンスされると、お互いを紐付け参照できるようにすること。クロスリファレンスを機能が提供されていることが、今時のMDMです。この機能がなければ、共通マスターです。そのほか、階層管理や版数管理、マッチング、サバイバーシップ、データ権限、ワークフロー、ローコード/ノーコードなどという機能もモダンなMDMソリューションの特徴です。

 

 

MDMの典型的な用途としては、顧客マスターであればシングルビューと360度ビューができます。シングルビューとは同一人物を紐付けること。360度ビューは、シングルビューを応用して、芋づる式にあらゆる側面の情報を得ることです。これはクロスリファレンスという機能が提供されているからこそ、できることです。

 

MDMの第一の要素技術が名寄せです。これがなければクロスリファレンスができないからです。名寄せの種類と方式はさまざまです。例えば名寄せ対象が法人と個人でも異なります。実施曲面もシステム構築時に1回行う移行名寄せ、また継続的日常業務の中で行う業務名寄せがあります。移行名寄せは汚いデータを名寄せする作業で、例えば空欄だらけのデータなど、システムの機能だけではできないことが多々、あります。業務名寄せはすでに登録しているデータをチェックするので、高品質の維持が可能です。用途については契約名寄せと統計名寄せがあります。そのほか目的は重複名寄せと横串名寄せ、関係は有人名寄せや家族名寄せという名寄せの種類と方式があります。

第二の要素技術が組織的な対応です。MDMの実現にはデータ部門の設置が欠かせません。業務部門にデータオーナーを割り当てるだけではすぐに失速してしまいます。データ部門の役割は大きく3つ。DGPO(データガバナンスプログラムオフィス:価値を訴求し予算を獲得する)、ルールの改善を行うデータマネジャ、実際のデータチェックや修正を行うデータスチュワードです。データスチュワードがデータをキレイにする役割を担います。

 

■TIBCO EBXはどんな機能を提供するソリューションなのか

ここからはTIBCO EBXというMDMソリューションについて説明します。
TIBCOは年間売り上げ1千億円ぐらいのグローバル企業。金融や証券系のシステムから始まっているので、金融系に強いという特長があります。金融系に強みを発揮し、1万1000社以上のお客さまを抱えています。同社には3つの柱となるソリューションがあります。リアルタイムにデータをつなぐ「CONNECT」、戦略を生むためのデータ価値化ツール「UNIFY」、可視化の一歩先を行く予測ツール「PREDICT」です。

EBXは、データモデリング、データの検証、名寄せ、版数管理、権限管理、分類カテゴリ管理、ワークフロー、データリネージュ、コンテンツ管理、iOS/Android対応、データ連携、KPI&ダッシュボードという12の主要機能を持つMDMソリューション。これらの中でも一番重要なのがデータモデリング機能です。

世間のMDMは製品マスター用のMDMと顧客マスター用のMDMというように分かれていましたが、EBXは在庫を定義してインタフェースを作ると、在庫マスターができます。データ検証機能を使えば、外のデータをインポートしてマッピングして形式を揃え、次の名寄せ機能で名寄せをすることもできます。版数管理機能もあるので、最新データだけではなく、変更前のデータも確認できます。版数管理では誰が、いつ修正した化なども把握できます。もちろん、たくさんの版数を保持しているとレスポンスが悪くなりますが、持とうと思えば果てしなく持つことができます。

権限管理機能では、例えば個人情報を閲覧や活用できる人を限定することができます。それをワークフロー機能に応用して権限を割り当てることで、その人専用のマスター登録画面やチェック画面が自動生成されます。このような仕組みにより、本来管理すべきではない人がワークフローを開いたとしても、データ権限がないので使えないので、事故を未然に防ぐことができます。

コンテンツ管理ではデータベースの中にあるテキストや数字だけではなく、写真やPDFなどについても入れることができ、ブラウザで観ることができます。分類カテゴリ管理はコード定義と非常に密接な関係があるところ。データリネージュはデータ紐付けの機能です。どういうデータをインポート、エクスポートしてどういう風に変換され、マッピングされているのかということが見えるようになります。iOS/Android対応はスマホでデータ管理ができる仕組みで、日本であまり活用されていませんが、海外ではそれなりに活用されているようです。EBXのデータ連携機能の特徴は、無理に書きにいかない、読みに行かないこと。またAPIやエクスポート、インポート、エクセルのアップロード、ダウンロードなどデータ連携のための口をたくさん用意していることも特徴です。APIは個別に作ることもできます。ダッシュボード機能では、データ品質の数値やワークフローの状況を管理することができます。マルチドメインMDMやリファレンスデータ管理などのユースケースについては、資料で確認ください。

 

■活発な質疑応答タイム
水谷氏の発表が終わり、Q&Aタイムに移った。

Q.(吉村氏)一番興味深かったのは意味的な統合です。各事業領域で担当している社員というのは、どういう社員でしょう。
A. 画面にする時に、「ここは君が担当」と任せたモノを切り出し、業務を担当している人なら分かる名前を付け、データモデルを作ります。データモデルを作った後は、システムが分からない人でも使える画面を作って渡して、確認してもらいます。

Q.(吉村氏)意味的なマッチングについてですが、ある部署では仕入れ先マスター、他の部署では取引先マスター、顧客マスターとなっている場合、それぞれの業務用に切り出したビューで見せてあげることができるのでしょうか。
A.用語が違うだけで、部門別呼び名もマスターを作って紐付けると同じようなことができると思います。部門別呼び名マスターがあり、表示画面の項目を決める設定をすれば、自分たちの呼び名でマスターを表示できます。そうでない場合は、それぞれのマスターを変換ロジックでつなぐ。このときに、一番細かい設定をしている部署に合わせる必要はあります。また階層管理については、分類カテゴリ管理を活用することで粒度の管理ができます。この階層の3層目をこの部門の人、4層目はこの部門の人が管理をするという分担もできます。構造データを移し込むことができるということも、分類カテゴリ管理機能の特徴だと思います。

Q.(伊阪氏)リポジトリマネジメントとセマンティックマネジメントをどうしているのか。プログラムを組むときに売り上げと書くと、山ほど売り上げが出てきてしまう。セマンティック的に別々に分かれているリポジトリ機能のようなものはあるのでしょうか。
A.あります。データモデルがそのものです。モノが同じで呼び名が違うときには、部門別〇〇というように、項目を足してあげれば良く、それをデータモデルにする場合もあるし、ビジネスグロッサリー付きマスターデータとして公開するという見せ方も可能です。

Q.(伊阪氏)伊阪 新しいファイルを作るときに、自分が製品名を入れるとすると、メタデータとして存在する可能性が高い。自分で何かデータベースを作る時に参照して見つけるのでしょうか。
A.名寄せ機能でマッチング&マージングを行います。既存で似ているモノがあるか、完全一致はもちろん、閾値を変えることで似たものを探すこともできます。

Q.(伊阪氏)ルールの恒久性について。ルール作りのデータバナンスに関するモデルは搭載されているのでしょうか。
A.ワークフローが鍵になると思います。データモデルを作ってデータスチュワードが観て事業に還元するという仕組みを回していくことで、レベルを上げていくことができると考えています。

Q.(伊阪氏)個人的願望を言えば、業種別モデルのようなものがあれば良いと思いますが。
A.なかなか難しいですね。例えば顧客マスター1つをとっても、メーカーでは顧客マスターは数十個だが、生保だと1万を超えますので。

Q.データ管理に関するルールは日本語で書くことができるのでしょうか。
A.日本語で記述できますが、日本語の人名、地名は非常に難しいため、クレンジングや名寄せは専門家に任せることを推奨します。

Q.国内事例はあるのでしょうか。
A.国内での事例はまだありません。

Q.版管理機能ではデータ変更について追いかけることができるのでしょうか。
A.データレイクはマスターではないので、追いかけることはできません。ただ、Data Spaceというデータベースを使うという奥の手があります。新製品がでたり、住所が変わったりなどがあっても、Data Spaceであればデータモデル一式を新旧記録できます。このソリューションを開発したフランス人エンジニアは、マスターデータのGitHubだと言っていました。バージョンがおかしければ戻すことができます。また階層構造が用意されているので、国別にコピーして日本版、スペイン版などを作ってもルールは継承されます。

Q.近年、サスティナビリティの一貫で、多くの企業がカーボンを減らすことに取り組んでいます。MDMはその貢献度を測定することに活用したいという企業は出てきていないのでしょうか。
A.そういう話はまだきていません。

 

■なぜデータガバナンスが必要なのか

質疑応答の後、伊阪氏の発表が始まった。テーマは「ESGに対するDG導入意義の考察」。伊阪氏の発表は以下の通り。

今、なぜデータガバナンスが必要なのか。10年前からIT視点の主要問題を明らかにするための質問例を配布しているが、先に進みません。「①統合的データ内容管理:マスターデータは常に不安定な状態にあること」「②各メタデータ横断的管理:常に急激に増殖し続けるメタデータへの対処」「③統合的DB構造管理:データベース構造的整備不備による業務に対する課題」「④業務管理とDB管理の独立性:マスターデータはすべてのプロジェクト(部門)にて対応が必要」「⑤データ資源管理:データ管理を無視すると主要な企業業務遂行に大きな影響」という5つの問題について、データガバナンスが問われています。

次に今流行のSDGsとESG、CG(コーポレートガバナンス)、DG(データガバナンス)の関係について整理してみました。縁の下の力持ち的な役割を担っているのがデータガバナンス。SDGsからみると、ESGが手段としてでてきます。この関係は非常に濃密です。ですが、ESGを実現するには基礎データが合致しているかどうかという問題が出てきます。つまりESGを実現するにはデータガバナンスのプラットフォームがきちんと構築できているかが非常に重要になります。一方、コーポレートガバナンスは1970年ごろからずっと言われてきており、平成27年の経済白書でもコーポレートガバナンスの重要性が記されていますが、進んでいません。ですが、コーポレートガバナンスとデータガバナンスの関係は希薄です。

データガバナンスはESGにどのような貢献をするのか。効果的な人材活用やリスクの高いプロジェクトへの対策という課題について、データガバナンスの貢献度は非常に高いことがある製薬会社の事例でも明らかです。そのほかにも顧客視点によるマーケティング強化、データ品質改善による経営合理化などへの貢献度も高いことがわかりました。製品・サービス管理の合理化、サプライチェン管理の合理化、コンプライアンス権限統制の推進ということもデータガバナンス視点からすると大きな課題になりますが、これらは各社個別に成熟モデルを作る必要があり、もたらされる価値についても企業ごとに異なります。またGDPRへの対応については、欧州や欧州の影響を大きく受けているアフリカに進出している企業であれば、大きく貢献します。またM&Aのスムーズなデータ管理も、想定している企業にとってはデータガバナンスを導入するとESGへの貢献度は高くなります。

 

■産業機器メーカーAにおけるデータガバナンス導入の期待効果

実際に産業機械メーカーA社の2021年3月期決算説明および中期経営戦略を元に、データガバナンスの期待効果について分析した結果を紹介します。A社では中期経営戦略では5つの戦略視点と、そのための施策を実施。例えば価値領域事業の強化という中継の戦略に対する施策として、トレーサビリティを強化し、部品流通をさらに効率化を掲げていました。ですが、トレーサビリティを強化すると、いろいろ迷惑をかけることになります。そこでデータガバナンスを導入により、部品データおよび地域ニーズ情報を統合し、部品・サービス品質を向上。MTTF(平均故障時間)とMTBF(平均故障間隔)、部品交換の予測により大幅な改善とMTBFの最小化を実現しました。もちろんこの背景には複数のDBMSに精度の高いデータクレジングを常に実施し、同時にデータ統合することで正確な把握ができるインフラがあります。

またA社では「サステナブルな社会の実現に向けて」という視点では、各種製品ならびに製品運用環境データをデータガバナンス視点で極めて詳細に収集・蓄積し、CO2削減経緯を管理することを実施。「ESG」という視点では、SDGsに対する社会要請に従う価値創出が求められます。社会価値、環境価値、経済価値の創出については、データガバナンス推進による効果が実現。またESG調整後の利益拡大、財務体質の強化と株価向上に対しては、データガバナンスの整備により迅速なESG推進と財務体質が改善しました。DIAMONDハーバード・ビジネス・レビュー日本語版の2021年1月号にESG特集が掲載されています。かなり面白い内容だったので、読むことをお勧めします。日経文庫の「ESGはやわかり」もわかりやすいので、お勧めです。
データ・ガバナンス・ライフサイクルは次のような図となります。この図では14番にレータレイクを作っていますが、ない場合はそこをスキップすることになります。

もしA社に私が啓発をするとなると、4日間で実施することができると考えています。データレイクが必要だと話を聞くことが増えていますが、データレイクにはいろいろな種類があります。A社であれば、次の図で示して提言します。悩ましいのが非構造化データです。どうやって入れるのか、私も悩んでおり、常にお客さまと相談しています。

データ品質の定義とデータガバナンスルール・モデルも作成していており、開示する予定です。一貫性や正確性の意味がよく理解できると思うので、品質について迷いが生じたらぜひ活用していただければと思います。

また名寄せの分類については水谷氏の知見を基に、付帯的要求という形で整理しました。この中で留意点は変遷履歴の③「データのコピーフロー(系譜、データ・リネージュ)は名寄せの手段として活用」というところ。系譜についてはまだ検討しなければならないと考えています。発表は以上です。

■発表後、短いながらも質疑応答タイムが設けられた。

Q.(神田氏)最終的にお客さまの実情に合わせたリポートを出すと思うのですが、テンプレートのようなものを用意しているのでしょうか。
A.啓発を必ず行い、業務問題などが最初の山となります。今日、紹介した資料(目指すデータレイク・タイプ)はデータ/ガバナンス/ライフサイクル・ステップモデルの「0)啓発」から「1)業務問題の定義」のところ。ここでお客さまとここでうまくそりが合わないと、その後はうまく進みません。

Q.(神田氏)「2)役員スポンサ確保」のステップ以降、コンサル料金が発生するのでしょうか。
A.啓発の段階も大変です。PDFで公開されている資料があると分析できますが、そういうものがなければ大量のデータを整理することから始まるので、1カ月かかります。手弁当では難しいですね。例えば先の製薬会社の事例では、財務の知識が乏しかったのでデータを読み込むのに3週間かかりました。ESGが絡んでくると会計学の勉強をせざるをえないと思います。ESGとデータガバナンスは同じガバナンスなので覚悟して勉強をしています。いずれにしてもデータガバナンスはESGの手段として、表舞台で活躍できる場が出てきたと実感しています。

 

 

<関連サイト>
・(報告)MDMとデータガバナンス研究会#4 ~AIを使ってマスタデータを整備する
・MDMとデータガバナンス研究会案内

<お知らせ>
次回の研究会は、2021年11月26日(金)18:30-20:30 参加ご希望は事務局まで(infoアットマークjapan-dmc.org)

記事を共有する :