JDMC会員による「リレーコラム」。
メンバーの皆さんそれぞれの経験・知見・想いをリレー形式でつなげていきます。
今回、バトンを受け取ったのは、NTTコムウェア株式会社の川前徳章さんです。
フランス革命から学ぶデータサイエンスの未来
メモリやCPUパワーの制約に悩まされたデータマイニング草創期
ドメインや時代が違っていても、過去の歴史から学べることはあるかもしれない。
私のメモリが確かならば、2000年代の前半は、データマイニング ブームの熱気が残っており、そこで触発されて現在のビッグデータやデータサイエンスにつながる世界に足を踏み入れた人が多かった。
かく言う私もその一人だった。当時の大学の共通計算機室には、貴族のマシンとも言われる学内でもっとも高価なマシンやワークステーションがあり、さながらベルサイユ宮殿のようであった。だが、一般の学部学生の身では自由には使えない。パンが無ければお菓子を食べるしかないので、研究室のマシンを使うことになるが、マシンの使いやすさと引き換えに、メモリ制約の洗礼をうけることになった。
そのマシン上で多変量解析の教科書の最初の方に出てくる手法を実装し、プログラムを動かすと、返ってくるのは結果ではなく「out of memory」のメッセージ。私も含め多くの学生は、ただでさえ小さい分析対象のデータサイズをさらに小さくするか、サンプリング方法を再考するかの選択を迫られた。データ分析のロジックに集中するためにも、物理的制約からの解放をめざす機運が我々の中に盛り上がっていった。
数年後、社会人になった頃は、ようやくギガ単位のメモリの価格も安くなり、汎用的なマシンだけでなくノートPCにも搭載されてきた。それでも凝った解析手法を試したり、欲張って分析対象のデータサイズを増やすと、また「out of memory」を目にしたり、あるいは計算はできるものの完了まで何時間も待つことになった。今度はメモリに加えCPUが物理的制約として重くのしかかってきたのだった。
急速に進むデータの民主化の先にはどんな未来が待ち受けている?
制約への不満の高まりを受けてか否か、最初の革命は2000年代の後半に起きた。世間ではビッグデータが話題になり、誰にでも使える分散処理のフレームワークが登場した。これは既存のフレームワークにはなかった、我々がデータ処理のロジック設計に集中できるという恩恵をもたらしたため、部分的とはいえメモリやCPUの制約から我々を解放した。
こうしたフレームワークのオープンソース化やクラウドサービスの登場が、データサイエンスの民主化を後押ししたのは間違いない。高度なプログラミング技術やアルゴリズムの選択からも解放されつつある。機械学習やAIですらも、もはや特権階級のものではない。
だがこの民主化がさらに進むと、欲しい結果を得るには手持ちのデータでは不十分という、データ不足の課題が新たに顕在化してきた。
そういったデータは、バスティーユとは違った場所に捕らわれているのだろうか? GDPRの施行にみられる、EUを中心としたここ数年のデータの取り扱いの動きを見ると、そう遠くないうちに彼ら=データは幽閉から解放されると予測する。
そこから先、データサイエンスの世界では何が起きるだろう? フランス革命のロベスピエール[i]のように、力で変革を推し進める独裁者が登場するのか? すでに、データ分析も機械学習も現在進行形で自動化が進んでいる。その先にあるのは、「もはや人間が関われるデータサイエンスの仕事はない」世界かもしれない。データ サイエンティストは、ラヴォアジエ[ii]のように惜しまれつつ野辺の露と消えるのか? それともラグランジュ[iii]のように生き延び、世界の改革者として叙勲の栄に浴すのか? それは、私自身が彼等になぞらえられるほどの功績をあげてから心配することにする。
川前 徳章 (かわまえ のりあき)
NTTコムウェア株式会社 Evangelist/東京大学 客員研究員
学部生時代に建築学科へ転科する決心を固めつつあった頃、ドイツ語の授業でコペンハーゲン解釈の解釈に触れ、「神がサイコロを振らないならば、完璧な設計図は何処にある?」と疑問を抱く。その設計図を求め、マーケティングサイエンス、情報検索、自然言語処理や統計的機械学習の世界を測量中。
~*~*~*~*~*~*~
※本脚注はWikipediaを参照、また一部抜粋して記載した。
[i]マクシミリアン・ロベスピエール:フランスの政治家で、史上初のテロリスト(恐怖政治家)・代表的な革命指導者。反対派を粛清し、自己の理想とする独立小生産者による共和制樹立を目指した。私生活は至って質素で、紳士的な服装や振る舞いは広く市民の尊敬を集めた。
[ii] アントワーヌ・ラヴォアジエ: フランスの化学者、貴族。質量保存の法則を発見、酸素の命名、フロギストン説を打破したことから「近代化学の父」と称される。化学の革命を成し遂げるものの、徴税請負人を務めていたため、革命裁判所にて「共和国に化学者は不要である」と指摘され、その日のうちに処刑された。
[iii] ジョゼフ=ルイ・ラグランジュ:プロイセン、フランスで活動し、オイラーと並び18世紀最大の数学者と賞される。マリー・アントワネットの数学教師でもあり、ラヴォアジエの処刑について「彼の頭を切り落とすのは一瞬だが、彼と同じ頭脳を持つものが現れるには100年かかるだろう」と語り、「なぜ私が残されたのかわからない」とマリー・アントワネットやラヴォアジエの処刑を嘆き、一生苦しんだ。レジオンドヌール勲章受章。