公開日:2022年7月17日

更新日:2022年7月17日

はじめに

DWHとは、データウェアハウスの略称で、企業や組織が膨大なデータを効率的に管理・分析するためのシステムです。このシステムを導入することで、複数のデータソースから収集したデータを一元管理し、高速なデータ分析が可能になります。
DWHは、データ分析に欠かせない重要なシステムであり、企業や組織のビジネスにおいて、ますます重要な役割を担っています。このレポートではDWHとは何か、そしてその役割や使い方についてわかりやすく解説しています。

 

DWHとは – データ ウェア ハウスとは何か?
DWHとは、企業が蓄積した膨大なデータを
統合し分析しやすくする仕組み

データウェアハウス(DWH)とは、企業が保有する膨大なデータを集積し、効率的に管理・分析するためのシステムのことです。DWHは、複数のデータソースからの大量のデータを抽出、変換、ロード(ETL)し、一元的に保管することができます。
このような構造により、企業は膨大なデータから価値ある情報を抽出し、ビジネスの意思決定や戦略策定に役立てることができます。また、DWHはデータの一貫性や正確性を保つことができるため、企業内での情報共有や統合も容易に行うことができます。
さらに、DWHにはデータを可視化し、分析するためのツールが多数用意されているため、データ分析のプロセスを効率化することができます。したがって、企業がビジネスの成長や競争力を強化するためには、DWHの導入が必須となっています。

 

DWHの必要性
DWHとは、英語では「Data WareHouse」と記述し、
直訳すると「データの倉庫」

ただ、データを集めただけの場所ではなく、ビジネスの状況を分析して意思決定に役立つようにデータを貯めておく場所になります。近年、ビッグデータといわれるようになり、あらゆるところからデータを取得できるようになり、蓄積量も大きくなってきていますが、それらのデータを活用するようにできていなければなりません。
では、データ整合性を持った正しい形の「データウェアハウス(DWH)」が作られていないと、どのようなことがおこってしまうのでしょうか。

 

■ データを情報として活用できない

  同じ意味の違うデータが散在している。
  例えば、システムによっても企業名を「取引先」、「仕入先」など複数の呼び名でデータが存在してしまう。

この場合、自社の全顧客名を取り出すことは困難になってしまう。

■ データの信頼性に欠ける

  さまざまなシステムからデータを抽出している場合、データ抽出のタイミングの違いによって、データの鮮度にばらつきが生じ信頼性が損なわれます。

 

■ 分析業務の生産性の低下

  同じようなデータベースをいろいろな部署で作成しており、非効率。

 

このような課題を解決するために、データを一元管理し統合したデータを格納するシステムが必要になります。

DWHの定義

データウェアハウスは、これまで二人の有識者によって牽引されてきました。DWHの父と言われるビル・インモン氏とデータウェアハウスの伝道師 ラルフ・キンボール氏です。
それぞれアプローチは違いますが、似た考え方でデータウェアハウスを定義づけています。

 

ビル・インモン氏は、データウェアハウスを次のように定義しています。

「サブジェクト別に統合化された時系列で不変の時系列要約データと明細データの集合」

ひとつひとつ紐解いていきましょう。

 

・サブジェクト指向

サブジェクト指向とは、データをサブジェクト(主題)ごとに分解、整理することです。
例えば、顧客分析をするとなると、顧客というサブジェクト(主題)の切り口で分析できなくてはなりません。
よって、顧客のデータだけを集約させる必要があります。

・統合化

システム毎にデータの名称やコード体系が異なります。
これらのデータの定義を全て統一する必要があります。

・時系列

データを時間的な順序で保存します。

・不変的

過去のデータを更新しません。
基幹システムはデータを上書きして最新のデータしか保存しません。

・集計データと詳細データ

トランザクションを構成する最小レベルの明細が含まれ、集計できるようになっている。

・履歴

過去のデータも保存します。

また、ビル・インモン氏と並び称されるラルフ・キンボール氏は、データウェアハウスを設計するための手段として、ディメンジョナルモデルというものを提唱しています。ディメンジョナルモデルとは、業務プロセスに関する量的データ(売上数など)を含むファクトとファクトデータを記述する属性が格納されたディメンションで構成され、データ利用者が行うファクトについての問い合わせに答えられるようになっているとしています。例えば、製造業のデータウェアハウスに例えていうならば、ファクトとディメンションは以下になります。
ファクト:販売価格、原価、収益などディメンション:時間、部門、所在地、製品などこの論理モデルを図化したものが下記の通りで、星形のようになっていることからスタースキーマと呼ばれています。

DWHについて2つの概念をご紹介しましたが、どちらかを選択するという話ではなく、上記2つを組み合わせた形で設計・構築することが重要です。

引用元:データマネジメント知識体系 第二版

ビジネスにおけるDWHとは
ビジネスにおけるDWHは、
重要な意思決定を支援するために必要なデータを、
迅速かつ正確に提供するために不可欠な存在

データウェアハウス(DWH)は、ビジネスにとって欠かせない存在です。なぜなら、企業が蓄積するビッグデータを効率的かつ正確に管理・分析することができるからです。
DWHには、複数のデータソースから取り込んだデータを統合するETLプロセスや、データのクエリやレポート作成に利用されるOLAPエンジンなどが備わっています。これにより、ビジネスの意思決定に必要なデータを迅速かつ正確に取り出すことが可能となります。
また、DWHはデータの標準化や品質管理を行うことができるため、データの信頼性を高めることができます。さらに、DWHはビジネスにおけるトレンドやパターンを発見することができるため、戦略的な意思決定に大きな影響を与えることができます。
以上のように、DWHはビジネスにとって欠かせないツールであり、今後ますます重要性が高まっていくことが予想されます。

 

DWHからデータプラットフォーム製品へ

DWHを構築する場合、従来はオンプレミスでOracle、SQL Server、Sybaseなどのデータベース製品と連携し利用するケースが多かったのですが、近年はSaaS型のデータプラットフォーム製品が市場を席巻しています。本記事では、その一部の製品をご紹介します。

DWHの利用が拡大していく中で、DWH用途に最適化されたデータベースが市場に次々に投入されてきていますので、データ量やユーザー数などの規模や利用形態など 要件に柔軟に対応できる製品を選択することをお勧めします。

 

ジールへのお問い合わせ

データ分析・データ活用・DX化に関する特典資料が無料でダウンロードできます


また、ZEAL DATA TIMESでは現在、「業種別・製品別でよくわかる!データ分析・データ活用・DX化導入事例集」をプレゼントしております。

特典資料の内容は?

全30社以上の企業様の導入事例冊子をプレゼントいたします。


本特典冊子は、30社以上の事例概要を一気に読むことができる特別資料となっております。
ジールはこれまで30年以上・1000社を超えるお客様へ、データ分析・データ活用・DX化のご支援をさせていただいて参りました。
そのうち、導入事例への掲載をご了承いただきました30社以上のお客様への過去の導入事例につきましてまとめましたのが本特典資料です。

【資料サンプル】全30社以上の企業様の導入事例概要を一気にご覧いただけます。



業種別・製品別の過去事例をご紹介しておりますので、貴社の事業のデータ分析・データ活用・DX化のヒントになれば幸いです。 少しでも興味がある方は、以下よりお早めにダウンロードください。


特典資料を無料でダウンロードする

新着記事