ブログ

DX・データ活用の取り組み速度を上げるには? – データ整備の視点から

データアナリストの大谷俊裕です。
以前、プロダクトマネージャーの横井のブログで、DX・データ利活用の進め方を紹介させていただきました。今回は、その中で言及している「STEP4. 適切なデータを施策に合う適切な形で整理する」、「STEP5. 小さく早く始め、データを見ながら拡げていく」についてフライウィールの持つ考え方やノウハウについてご紹介させていただきます。
これから自社のDX・データ利活用を推進していく予定の方や、既に進行中でデータ整備や前処理に課題を感じだしている方の参考になればと思います。

DX(デジタルトランスフォーメーション)とは

そもそもDXとは何でしょうか?経済産業省の定めるガイドラインでは以下の様に定義されています。
「企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用して、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するとともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性を確立すること。」*
データを利活用しながら、組織やビジネスモデルを変革し、事業価値を産み出していく事がDXと言われているようです。同時に、競争上の優位性を確立するものはビジネスモデルや業務、組織等であり、データそのものが直接的に価値を産むのではなく、データの利活用を通して変革したビジネスモデルや組織、業務が事業価値を生むと読み取ることができます。
このとおり、最終的に実現したいDXの内容がどのようなものであっても、その根っこにはデータの存在があり、データを適切に処理できる事がDX実現のための大きな柱の一つであることは間違いないでしょう。
*出典 : 経済産業省 デジタルトランスフォーメーションを推進するための ガイドライン(DX 推進ガイドライン) Ver. 1.0

コストの圧縮から高品質を目指せる

さて、「データを適切に処理できる」と書きましたが、企業の経済活動の中で適切な状態とは、低コストかつ短期間で、最大の価値を発揮している状態を指すと考えます。それでは、データ活用のプロセスの中で何にコストがかかっているのでしょうか?
データ活用の実行段階におけるデータ処理プロセスは「収集」「蓄積」「加工」「活用」の4つのフェーズに分けられます。この中で最も多く時間がかかるのは「加工」の段階であると言われています。トーマス・H・ダベンポートは著書『データアナリティクス3.0 ビッグデータ超先進企業の挑戦』の中で、「アナリストの作業時間のうち、一般的に75~80パーセントがデータの収集、クレンジング、分析前の下準備に費やされている」と述べています。
つまり、データから事業価値を創出する「活用」フェーズに至る手前のプロセスに最も多くの時間がかかるのです。「収集」「蓄積」「加工」のデータ整備にかかる時間を圧縮することができれば、日々実践するDXの取り組みにスピード感が生まれます。より多くのPDCAサイクルを回すことができ、より高い価値を生む可能性が高まっていくことは想像に難くないでしょう。

中間集計データにおける3つのポイント

フライウィールはデータの整備・前処理にかかる時間を削減するためのノウハウやツールを保有しています。今回はその中から中間集計データの設計と実装に関するものをお伝えします。
中間集計データとは組織内外から収集した多種多様なデータを、「活用」フェーズで使いやすい状態に整備したものです。DX・データ活用を実践していく中で中間集計データの作成は、作業の効率化やコスト削減の観点からほぼ必須ですが、その作成方針や設計には企業毎に違いがあります。受注管理や販売管理などの業務システムで使用するデータベースと同等の設計で実装を行う企業もあれば、その時々の目的に沿った実装をその都度行う企業など様々です。この設計方針の違いがデータ整備にかかる時間に大きく影響します。
この中間集計データの設計においてフライウィールで重要視している点をいくつかご紹介します。これはDX・データ利活用の進め方で記載している通り、「小さく早く始め、データを見ながら拡げていく」ことから正しい意思決定をスピーディーに行い、DXによる事業収益化を拡げていく際の重要な視点です。
(1) 再利用性が高いこと
(2) 変更容易性が高いこと
(3) 利用時の負荷が低いこと

(1) 再利用性が高いこと

多くの施策で活用されうる再利用性の高い中間集計データを作成することで、新たな取り組みを開始する際でも、再開発の必要性を減じることができます。再利用性を高めることは、ビジネスロジックから切り離し、特定の目的への依存度を下げること、未来において使用する可能性が高いデータ(現時点で必須ではないものを含む)を中間集計に取り込むこと等で実現できます。また、適度にリファクタリングを行い、中間集計データをアップデートし続けることで、再利用性の高さを継続的に向上させています。

(2) 変更容易性が高いこと

DXの取り組みの変化に柔軟に対応していくために、中間データのデータ構造も変化していくことを前提として設計しています。これは例えば中間集計データのテーブルの正規化 (※1)を最低限に抑えることで、設計の変更や再集計の実施を容易にしています。このように、設計が変化することを前提とし、中間集計データを適宜作り変えたり、追加していくことで、前述の再利用性を高めることにも寄与しています。
※1. テーブルの正規化 … WEBアプリケーションや業務システムなどで使用されるデータベースの設計及びそのプロセス。一般的に正規化することで、DB上で発生するデータの不整合や矛盾を防止できる。一方、データ構造自体を変更させたい時に、影響する範囲が多くなり変更が容易でなくなる事が多い。

(3) 利用時の負荷が低いこと

利用時の負荷はデータを集計し、活用する際にかかる時間に直結します。わかりやすく、使いやすいデータ構造とする事で、この負荷を下げることができます。具体的には、WEBアプリケーション、業務システム、スマホアプリなど多種多様なソースから収集したデータを統一的なデータ構造に変換し、整然化(※2)することで人にとってわかりやすいデータ構造にしています。また、データ構造が統一化されているため、多種多様なデータを一度に集計でき、開発コストも低減されます。
※2. 整然化 … 整然データと呼ばれる、データが持つ意味を引き出しやすい、データ分析/データ活用に適したデータ構造への変換を意味しています。

さいごに

今回は、DX・データ活用の実現のために必要なデータ処理の中で大きなコストを占めるデータの前処理部分について、中間集計データという切り口でフライウィールの考えやノウハウをご紹介させていただきました。フライウィールのデータプラットフォームはこの内容以外にもデータからより多くの価値を創出するためのモジュールを備えています。これから自社のDXを推進していく方や、現在進行中でデータの取扱いに課題を感じている方への一助となれば幸いです。


フライウィールへのお問い合わせはこちらのフォームからお願いします。
また、データアナリストとしてクライアントのDXをデータの観点から支援していくメンバーの採用も積極的に行っています。



Author: 大谷俊裕(フライウィール データアナリスト)
大手広告代理店にてコンサルタントとして、メーカーや金融機関などの大手クライアントのマーケティング領域でのデータ活用を支援。それ以前はDeNAのデータ分析部門に所属。同社が運営するWebサービスのユーザー行動分析や事業上の意思決定を支援する分析組織をマネジメント。