「データベース応用」カテゴリーアーカイブ

【応用情報】
・データベースの応用対象,応用方法を修得し,応用する。
・分散データベースの特徴,機能を修得し,応用する。
・データ資源管理の仕組みとして,リポジトリ,データディクショナリを修得し,応用する。

【基本情報】
・データ分析,業務システム,ソフトウェア開発と保守などに,データベースがどのように応用されているかを理解する。
・分散データベースの特徴,利点,留意事項,データ同期の仕組みを理解する。
・データ資源管理のあらましを理解する。

データベース応用

情報処理技術者試験での学習内容

【応用情報】
・データベースの応用対象,応用方法を修得し,応用する。
・分散データベースの特徴,機能を修得し,応用する。
・データ資源管理の仕組みとして,リポジトリ,データディクショナリを修得し,応用する。

【基本情報】
・データ分析,業務システム,ソフトウェア開発と保守などに,データベースがどのように応用されているかを理解する。
・分散データベースの特徴,利点,留意事項,データ同期の仕組みを理解する。
・データ資源管理のあらましを理解する。

(1)データベースの応用 基本情報 応用情報

データウェアハウス,データマート,OLAP(Online Analytical Processing),データマイニングなど,データを分析して有効活用する技術の特徴,これらの技術が企業会計システム,在庫管理システムなどで使われていること,その応用方法を理解する。

用語例:OLTP(Online Transaction Processing),ETL(Extract/Transform/Load),データクレンジング,ビッグデータ,文書管理システム,営業支援システム

(2)分散データベース 基本情報 応用情報

複数のサイトに配置された分散データベースの特徴,利点,取り扱う上での留意事項,サイト間でのデータ同期の仕組み,関連する機能,集中型データベースとの違いを理解する。

透過性,クライアントキャッシュ,コミットメント制御,2 相コミットメント,コミットシーケンス,同時実行制御,レプリケーション,水平分散,垂直分散,表の分散(水平,垂直),分散問合せ,結合演算,分散トランザクション,OSIRDA(Open Systems Interconnection-Remote Database Access:開放型システム間相互接続-遠隔データベースアクセス)プロトコル

(3)データ資源管理 基本情報 応用情報

データの属性,意味内容,格納場所など,データを管理するための情報(メタデータ)を収集,管理したデータディクショナリや,ソフトウェア開発と保守における様々な情報を一元的に管理するリポジトリを理解する。

IRDS(Information Resource Dictionary System:情報資源辞書システム),ファクトデータベース,リファレンスデータベース,データベースサービス

 

データベースの応用

この記事での学習内容 基本情報 応用情報

データウェアハウス,データマート,OLAP(Online Analytical Processing),データマイニングなど,データを分析して有効活用する技術の特徴,これらの技術が企業会計システム,在庫管理システムなどで使われていること,その応用方法を理解する。

用語例:OLTP(Online Transaction Processing),ETL(Extract/Transform/Load),データクレンジング,ビッグデータ,文書管理システム,営業支援システム

データウェアハウス

データウェアハウスとは、トランザクション(取引)などの時系列データを、長期的に大量に蓄積したデータベースの一種です。通常のデータベースと異なり、過去の取引データを消去することなく、時系列的な分析に用いるのが特徴です。

例えば、商品ごとの売上高と気象とに因果関係がある場合には、長年の取引データを保管して、気象データと照合して分析することによって、今後の購買管理、製造管理、在庫管理、あるいは販売管理などの精度を上げることができます。

ウェアハウス(倉庫)という言葉が用いられているように、データウェアハウスは、通常のデータベースに比べて、データの更新や検索の回数は比較的少ない代わりに、膨大な記憶容量を必要とします。

データマート

データマートとは、データウェアハウスの中から、特定の目的に合う部分を抽出して、通常は部門や個人のデータベースに格納したものです。蓄積されたデータを分析する時の処理効率を良くするのが目的です。

OLAP

オンライン分析処理(Online Analytical Processing:OLAP)とは、データウェアハウスやデータマートを使い、複雑な分析を短い応答時間で処理することです。市場分析、予算作成、経営報告、財務諸表作成など膨大なデータの分析作業を支援します。

関係データベースが共通データを一元的に保管するのに比べて、商品別、地域別、月別などの多次元的な観点で傾向を発見したり、整理したりするという特徴があります。

汎用的な統計ソフトウェアを用いるのと比べると、分析や報告を繰り返しながら、作業の改善や自動化を継続していくという傾向があります。

データマイニング

データマイニングとは、統計的手法などを活用して、膨大なデータを分析して、発見的に新たなノウハウを発掘する作業のことです。

発見的分析を助けるコンピュータグラフィックスなどの具体的な技術を指すこともありますが、確たる技法や技術が揃っているわけではなく、ナノテクノロジのような包括的なキャッチフレーズのような位置づけです。

 

データウェアハウスやデータマート、OLAP、データマイニングなどのデータベースの応用技術は、企業会計システム、在庫管理システム、文書管理システム、営業支援システムなどを高度化するために用いられています。

分散データベース

この記事での学習内容 基本情報 応用情報

複数のサイトに配置された分散データベースの特徴,利点,取り扱う上での留意事項,サイト間でのデータ同期の仕組み,関連する機能,集中型データベースとの違いを理解する。

透過性,クライアントキャッシュ,コミットメント制御,2 相コミットメント,コミットシーケンス,同時実行制御,レプリケーション,水平分散,垂直分散,表の分散(水平,垂直),分散問合せ,結合演算,分散トランザクション,OSIRDA(Open Systems Interconnection-Remote Database Access:開放型システム間相互接続-遠隔データベースアクセス)プロトコル

分散データベースの特徴、利点、留意事項

分散データベース(Distributed Database)とは、複数の場所に分散されたデータベース群が、一つのものであるかのように扱えるデータベースです。場所は一つのコンピュータの複数の記憶装置である場合、局所ネットワークのサーバである場合、あるいはインターネットで結ばれている場合などがあります。

集中データベースと比べると、分散データベースは以下のような特徴や目的を持っています。

性能の向上
拠点と各地とで検索・更新が分散している場合、よく検索・更新するデータは、地域に分散したほうが応答時間や通信費用が改善される。
構造の多様性
データベースの定義を拠点で標準化するのに対して、地域に権限を移譲したり、合併した企業の独自性を尊重したりして、柔軟性を重視しつつ緩やかに連携する。
段階的な増強
一度に情報システムを拠点に完成してしまうのではなく、時間とともに段階的なサーバなどを追加したり、リプレースしたりしていく方式。コンピュータ、記憶装置、および通信回線の価格低下と性能向上を見越したり、ユーザ側のニーズの変化を見越したりして取られる方式である。
障害対策
大きな災害に備えて、データを分散したり、複製を別の地域においたりして、被害の最小化や回復容易性を狙う。

分散データベースの利用にあたっては、以下のような点に留意する必要があります。

  • 変更の同期: コミットメント制御などにより、障害が発生したときにもデータの一貫性が保たれるようにする。(2相コミットメントなど)
  • 透過性: 分散データベース特有のデータの存在場所などをユーザに意識させず、ユーザには集中データベースと同じようにみえること。
  • オープン性: DBMSと多様なハードウェア、オペレーティングシステム、応用ソフトウェアとの連携を受け入れる性質。分散すると関連する要素が増えるので特に重要である。
  • アクセスの節減: データベースの設計、レプリケーション、およびユーザの問合せ分の注意によって、遠隔地への問合せや更新の頻度を減らす。

透過性

透過性とは、分散データベース特有のデータの存在場所などをユーザに意識させず、ユーザからは集中データベースと同じようにみえるという性質です。

以下のような特性で構成されます。

  • 位置透過性: データの存在場所を意識せずに利用できる性質。
  • 移動透過性: データの存在場所が変更されても、影響なく利用できる性質。
  • 重複透過性: 一つの表が複数の存在場所に重複して存在しても、意識せずに利用できる性質。
  • 分割透過性: 一つの表が複数の場所に分割されて存在しても、意識せずに利用できる性質。
  • 障害透過性: ある場所に障害が発生しても、代替場所が代替することによって、利用し続けることが出来る性質。
  • データモデル透過性: 各場所のデータモデルが階層型データベース、関係データベースなどと異なっても、意識せずに利用できる性質。

サイト間でのデータ同期の仕組み

データ更新の際、サイトごとのデータベースと同時に更新する方法と、一台の管理サーバ(マスタサーバ)が更新処理を受け付けて、その後スレーブサーバを更新する方法の2種類があります。

前者を同期マルチマスタ方式、後者を非同期マスタスレーブ方式と呼んでいます。

レプリケーション

レプリケーションとは、データの複製を別の場所にも作成し。常に内容が一致するように更新することです。負荷分散や障害対応を目的としています。

レプリケーションは、障害透過性を向上させることができます。また、データを重複させても、重複透過性が保たれることが必要です。

 

 

データ資源管理

この記事での学習内容 基本情報 応用情報

データの属性,意味内容,格納場所など,データを管理するための情報(メタデータ)を収集,管理したデータディクショナリや,ソフトウェア開発と保守における様々な情報を一元的に管理するリポジトリを理解する。

IRDS(Information Resource Dictionary System:情報資源辞書システム),ファクトデータベース,リファレンスデータベース,データベースサービス

データディクショナリ

データ項目の名称や意味を登録した辞書のことです。「データ辞書」と呼ぶこともあります。

企業情報システムにおけるデータディクショナリは、データの整合性を保つためのデータ定義を標準化する役割を果たします。

データベースの重複や、同じ意味を持つデータの呼び方が複数存在したり、逆に同じ名称のデータが異なる意味を持ったりして、システムが肥大化することを防ぎます。

リポジトリ

リポジトリはデータベースの類似語であり、様々な意味で使われます。小さなデータベース、簡易なデータベース、検索機能のある文書ライブラリ、あるいはユーザが意識しないシステム内部の共通データやメタデータのファイルなどの意味で使われます。全体として、「小さめの」や「共有資産」のようなニュアンスがあります。

特に文書・プログラムのバージョン管理システムではリポジトリという用語が使われることが多くあります。

IRDS(情報資源辞書システム)

情報資源辞書システム(Information Resource Dictionary System:IRDS)とは、データベースのデータ辞書にとどまらず、情報資源全体の辞書システムです。

全社情報システムの辞書、ソフトウェア開発支援システムの辞書、およびデータベース設計の時に必要な辞書を、標準化して統合管理するシステムです。