社内外のデータを捜索し、データの活用促進を促す「データカタログ」。
様々な会社がサービスを展開する中、そもそもデータカタログとはどんな仕組みなのか?また、活用方法はどうしたらいいのか?を
当社で取扱いのあるDenodo社製データカタログの操作画面を交えてご説明いたします。
データカタログの魅力とは?
データカタログとは?
データカタログは、組織内のデータ資産を集約し、一元的に管理するためのインベントリです。このカタログは、データセットやデータソースの詳細情報をメタデータ化し、必要なデータを利用者が容易に見つけることができる仕組みになっています。
例えば、データカタログを導入することで、管理情報やデータ自体の情報を基にデータ捜索ができるようになります。
Denodo社製データカタログと一般的な製品の違い
一般的なデータ活用基盤では、社内システムに散乱している膨大なデータをETLでデータウェアハウス(DWH)へ物理的な収集を行い、一元管理をします。その後、別のカタログ製品と組み合わせて、データの見える化を行うことが主流でした。
一方、Denodoは、データ仮想化技術によって物理的なデータの集約が不要になります。仮想的なDWH内でデータ活用ができるため、リアルタイムでのデータ取得や変更が容易にでき、柔軟なデータ環境を構築することが可能です。Denodoのデータカタログはこの仮想環境と一体化した形で提供されます。
Denodo社製データカタログの7つの魅力
① 検索後、すぐにデータ活用できる
他社のデータカタログはデータの源泉からメタデータを取得しカタログを構成するのに対し、Denodoは仮想データベースと一体化しているので、検索した後すぐにデータ活用ができます。
② 豊富なコネクタが標準搭載
豊富なコネクタが標準搭載多岐にわたるデータソースに接続するためのコネクタが提供されているため、追加のコネクタ費用を節約できます。
③ Denodo1つでデータカタログまでカバー
Denodo1つでデータカタログまでカバーデータ仮想化(接続・結合・活用)とデータカタログが一体化しており、Denodo Platform1つのライセンスで完結したサービスが利用できます。
④ データを発見して、活用するまでの連携が容易
データを発見して、活用するまでの連携が容易データを探索し始めてからBIツールなどで利活用するまでの工程を、シームレスに連携できます。
⑤ データの発見だけでなく、詳細なデータ情報まで把握可能
データの発見だけでなく、詳細なデータ情報まで把握可能データの検索時に、データ遍歴、およびデータの概要情報(サイズ、範囲等)がDenodo内で確認可能です。
⑥ 思いついたキーワードで、欲しいデータを簡単検索
思いついたキーワードで、欲しいデータを簡単検索OpenAIと連携することによって、ウェブ検索のような直感的なワード(自然言語)でデータ探索が可能です。
⑦ データの整理と関連データの発見が効率的
データの整理と関連データの発見が効率的大量のデータをカテゴリやキーワードごとに整理でき(タグ機能/カテゴリ機能)、目的に沿った適切なデータを簡単に見つけられます。また、データマネジメントにも有効です。
データ活用を促す!データカタログ3つの機能
データカタログ内のデータ捜索方法は、検索機能(キーワード/プロパティ)・カテゴリ機能・タグ機能・フォルダ機能があります。それぞれの機能を使い分けていただくことにより、各ユーザーが効率的にデータを捜索することができます。
今回は様々な検索方法のうち、お客様から問い合わせの多いプロパティ機能 ・タグ機能 ・カテゴリ機能の3つの機能の活用方法をお伝えします。
カテゴリ機能の設定
カテゴリ機能とは?
カテゴリ機能とは、仕事やタスクなどの基準にもとづいてデータをまとめる方法です。例えば、販売データを管理する場合、Tシャツや靴などの商品の種類や販売地域などをカテゴリとして使うことができます。さらに、それらのカテゴリ内にサブカテゴリを作成でき、より細かく分類することが可能です。分類によりデータが整理され、必要な情報を見つけやすくなります。
データ活用を促すカテゴリ機能
カテゴリ機能の活用ポイントは、階層を作れることです。階層構造にすることにより、関連データが見やすくなり、欲しいデータを絞り込みやすくなります。
例えば、下図の弊社事例では、“データ商事”という企業名カテゴリの配下に、“アナリティクス事業部“”マネジメント事業部“という事業部名、さらにその下に部署ごとのカテゴリを用意し、ユーザー同士がすぐに理解しやすい構造にしています。
上図カテゴリ検索結果のように、「どの部門が対応した、どの部署のデータか?」が明確に分かるようになります。
また、所属ごとに分ける方法以外にも、様々なカテゴリ名のつけ方があります(下図参照)。参考までにご覧ください。
タグ機能の設定
タグ機能とは?
タグは、データに付けられるラベルのようなもので、そのデータを説明する役割を果たします。例えば、写真を整理する際に、”友達との食事”や”家族との外出”といったタグを付けることで、その写真がどんな場面で撮られたものなのかを分かりやすくします。また、同じタグをつけた別の写真を検索、参照する際に見つけやすくなります。
データ活用を促すタグ機能
タグ機能の活用ポイントは、共通項目の名前を付けることです。共通項目の名前を付けることで、各カテゴリに格納したビューの階層構造を意識せずに、関連データが見つけやすくなります。
例えば、下図のように、どの部署でも利用されるキーワードを設定することにより、事業部を横断的に検索することが可能です。
上図タグ検索結果のように、「製造タグを持つ他部署の同様データへの横断的なアクセス」が簡単にできるようになります。
また、上図例以外にも、様々なタグ名のつけ方があります(下図参照)。
参考までにご覧ください。
プロパティ機能の設定
プロパティ機能とは
プロパティ機能は、データを管理する際に、独自の項目名を設定し、必要な管理項目を追加できる機能です。例えば、ドキュメントやファイルを整理する際に、”ビューの所有者”などカスタムした項目を追加することで、管理を効果的に行うことができます。また、検索時に項目名を入力することで絞り込むことも可能です。
データ活用を促すプロパティ機能
プロパティ機能の特徴は、データマネジメントの要件を満たせる項目があることです。機能活用の前に、データに対する社内(ガバナンス)ルールを制定することで、プロパティ機能を有効活用する準備が整います。
例えば、下図のように、データソースごとのシステム管理者を入れることで、役割によって閲覧権限がないユーザーの問い合わせ先を明確化します。
プロパティ機能で付与できる項目は下図になります。
エレメントの所有者 |
エレメントの管理者 |
そのエレメントが検証済みか、また誰によって検証されたか |
そのエレメントに対するアクセス許可の保持者 |
ビューまたは Web サービスの想定実行時間 |
ビューに対する現在のユーザーの実行アクセス許可を要求するためのリンク
このリンクを使用して、データガバナンスツールなどの外部ツールを参照できます |
データ品質規制とデータプライバシー規制に関する情報 |
その他 |