情報発信元:https://prtimes.jp/main/html/rd/p/000000001.000107091.html
(※外部サイト「PR TIMES」を別ウィンドウで開きます)
データ駆動型経営の実現に向けたコンサルティングを提供するLiberty Nationは、データ活用において最大の障壁となっている属人管理のデータと未整備システムのデータを可視化、標準化、重要性評価で支援する「データ標準化ラボ」の提供を開始した。
「データ標準化ラボ」で対象とする企業課題
データ活用を始める多くの企業にとって、最大の障壁となるのは属人管理されていたデータ・未整備であったシステムデータを可視化・標準化する段階にあることが多い。実際に97%の企業は高度なデータ活用以前のデータ適正化工程で躓いており、満足する効果を得られていない。
よくある企業の課題としては以下の通りだ。
- データ整備の必要性はわかっているが、整備方法がわからない。
- 全社的なシステム基盤を作りたいが、ユーザ毎にカスタマイズされたデータベースが多く、整備範囲が広すぎる。
- データ活用フェーズに進んだものの、データ整理や前処理にかかる工数が多いために、具体的な活用を行うことができていない。
「データ標準化ラボ」が対象とするデータ
本サービスでは以下のデータが抱えやすい課題の解決が可能だ。
- データ結合・品質適正化をしないまま統合されたら業務システムの大規模データ
課題
- DWH(データウェアハウス)(※1)などが導入されていても、異なるシステム間で横断的な利用が行われることを想定したデータ構造になっていないため、必要な情報を探し出すのに時間がかかってしまう。
- 未入力・誤入力・測定異常・名寄せ(※2)などでデータがそのまま利用できない状態となっているために、活用テーマ別に都度大量の加工作業が必要となる。
- 運用上は重要だがDWHから除外されており使えない属人化したデータ
営業部門では営業販売見込や顧客の個別詳細情報のデータが、マーケティング部門では販促効果見込やキャンペーン施策詳細などのデータが属人化しており、データ活用をする段階にない状態である。
(※1)データウェアハウスとは・・・
企業活動で蓄積された大量のデータを利用者のニーズに応じて活用(情報を引き出したり・分析したり)できるようにするためのシステム。
引用元:IDC Frontier|用語集「データウェアハウス」
(※2)名寄せとは・・
複数のデータベースのなかから、氏名・住所・電話番号などの情報を手がかりにして、同じ人物や同じ企業のデータを1つにまとめる作業のこと。
引用元:Senses|名寄せとは?
「データ標準化ラボ」ができること
- 適切なデータ要件の定義
- 国際的なデータ品質基準を低コストで提供
- 大規模データだけでなく、表構造以外の画像や設計文書なども対象
【執筆者コメント】
今回はDX推進のためのデータ標準化に関する例をご紹介いたしました。
PwCによると(※3)、ITにおけるデータ標準化とはデータの書式や列の並び、データの入力規則などが企業ごとに異なる場合にそれらを統一すること、とされています。
そもそも、各組織で扱うデータが異なる形式(表形式、階層構造など)になっていると、組織を跨いだデータ活用をすることができません。そこで、組織・システムを横断してデータ連携をするために、「データ標準化」が必要となります。
身近な例として、銀行アプリと資産管理アプリをAPIで連携することでより便利にサービスを利用することができますが、これも標準化が行われて初めて実現するものと言えるでしょう。
AIなど、より高度なデータ活用を行うためには、データがデジタル化(スキャンによるPDF化など)されていることは前提として、編集可能であることや、共通の意味や構造を持っているなど、機械可読性(※4)が高いデータが必要となります。
一方で、幾多のデータを機械可読性の高いデータに変換する作業は膨大かつ専門性が必要となるため、特に事業会社では独自にデータ活用を推進することが難しい状況となっています。
今回ご紹介したデータ標準化のナレッジを持つ企業などとの協業により、ナレッジをもたない事業会社であったとしてもデータ活用に向けて動き始めることはできるでしょう。しかしながら、事業会社自身に業務改革を進めていく気概が無ければ、DXの第一歩となるデータ標準化さえも中途半端に終わってしまうことになりそうです。
データ活用を含むDX実現のためには、ツールを導入することやコンサルティングサービスを受けるなど多くの選択肢はありますが、どれを選ぶにせよ企業自身がデータ活用に興味を向け、自分の足で歩みを進められるかどうかがカギとなりそうです。
(※3)PwC|DXの成否を決めるデータ標準化
(※4)機械可読性とは・・・コンピュータ上のデータ集合やファイルの持つ性質の一つで、記述された内容がコンピュータプログラムによって容易に処理可能であること。(引用元:IT用語辞典 e-Word|機械可読(マシンリーダブル)とは)
執筆者/
リビルダーズ編集部 城間 礼音