データウエアハウス (Data Warehouse)

複数のデータベースに蓄積されたデータを高度利用するための(大規模)データ格納システムをいう.90年代半ば頃より,様々な業種の様々な業務において,データを高度に有効利用する必要性が高まり,盛んに導入されるようになった.例えば,小売業の顧客管理データベースでは,日々,顧客情報の登録,削除が行われる.また,顧客との取引記録などはデータベースに日々蓄積されていく.このような企業固有の情報の他にも,市場情報など,データ分析に有用な各種の外部の情報源が存在している.多様で,複数の情報源から得られる,長期間にわたるデータを正確に把握すること,さらに,それらのデータから有用な法則を発見することは,企業の意思決定を行ううえで非常に重要であり,データウエアハウスはそうした目的で構築される.

下図に一般的なデータウエアハウスの構成例を示す.データウエアハウスは,企業活動などが記録されている運用データベースや外部データから分析に必要なデータを取り出す.その際,多種多様な情報源から得られるデータの整合性や,意味的な同一性などを考慮したデータ変換を行う.また,運用データベース,外部データの内容は日々,更新されるため,必要の応じてウエアハウス内のデータ更新を行う.さらに,管理しているデータの多次元集計結果など,必要な分析情報をサービスとして提供する.データウエアハウスは,これらの機能を,データの統計情報などを管理しているメタデータ/管理データの情報を利用し,効率的に行う.



解説記事・関連記事
データで変わるスポーツが変わる 日本IBM Compassより
(OLAPの有効性の一端を一般向けにわかりやすく解説しています)