セルフサービスBIが普及し、データアクセスの機会が一般ユーザーにも拡がっていますが、データ自体も多種多様になり、データ管理者でないユーザーが目的とするデータを探し出すことが困難になりつつあります。このような状況から、データの管理を行うための付帯情報(メタデータ)をあらかじめ整理しておき、その所在を容易に見つけることができる仕組みが「データカタログ」です。
BIツールなどでデータ分析を行う際、データリポジトリから取り出すデータは目的の用途に対して正確かつ適切に整理されていることが重要です。そのための仕組みとして、そのデータを表す属性や関連する情報を記述したさまざまな付帯情報を一元的に管理/検索する手段がデータカタログです。しかしながら、従来のデータ統合基盤では技術面・運用面での実装が難しいとされていました。
Denodoのデータカタログは、データ仮想化の定義をそのまま再利用したビジネスユーザー向けの標準機能であり、従来のカタログ(カテゴリとタグ付け、データ属性、説明等)機能に、キーワードベースのメタデータ検索、データの検索や関連性の確認などが組み合わされたもので、必要とするデータを容易に探し出すことができます。
データカタログの操作は、データ分析を行うビジネスユーザー自ら、WebブラウザでDenodoのデータカタログポータルから検索キーワードを打ち込むだけで、関連性のあるデータ資産を即座にカタログから検索できます。検索結果から、メタデータのサマリー確認やクエリの実行、データリネージによるデータの来歴/影響分析も可能です。
データカタログは、Denodoが接続する様々なデータソースからメタデータを抽出し、それらをメタデータリポジトリに格納・整理します。管理できるメタデータは、項目名・テーブル名・ファイル名だけでなく、ビジネス用語・データ種別・リレーションシップ(関連性)などの付加属性などで、Denodo内の論理データウェアハウスで定義したビューがそのままカタログに同期して反映されます。