データベース2 - 一問一答の一歩

問題1

有用なデータを取り出すこと

データマイニングが正解です

mining(マイニング)には発掘するという意味があります。
本来は埋もれた古いものを見つけ出すという意味がありますが、デ－タベ－スは大抵複雑に入り組んでいるため、見きれないほどたくさんあるデ－タから欲しいデ－タを取り出すことは効率化に大きな意味を持ちます。
データディクショナリはメタデータを効率よく管理すること、データクレンジングはデータを一体系に統一することです。

問題2

データを一体系に統一すること

データクレンジングが正解です

Cleansing(クレンジング)はClean(クリ－ン)という「綺麗にする」という意味が派生した単語であり、元の単語と似たような意味を持ちます。
また、学校の水道の掃除に似た「クレンザー」が響きも意味も似ているので、そちらと関連させて理解するのも問題ないです。
デ－タクレンジングはデ－タを整理する方法の一つであり、デ－タの体系を統一することで、人間が理解しやすくなったり、デ－タを探しやすくなるというメリットがあります。

問題3

検索効率を上げるためにデータ加工をすること

データマートが正解です

Mart(マート)は「市場」という意味の英単語です。
市場に売られているものは見えない工夫がたくさんなされており、その結果としてより注目されて、売れやすくなるようになっています。
それと同じように、検索ですぐ現れて、使われやすくなるようにデ－タを加工することはデ－タマ－トと呼ばれています。

問題4

大量のデータをそのままの形で保存されたもの

データレイクが正解です

Lake(レイク)は「池」という意味があります。
デ－タベ－スを作成するほどのデ－タ量となってくると、加工してから入れるというのは大変なので、とりあえず入れておくということが発生します。それは、デ－タの池のように見えることからデ－タレイクと呼ばれています。

問題5

メタデータを効率よく管理すること

データディクショナリが正解です

問題文中に出てきたメタデ－タとはデ－タに関するデ－タのことを指しています。具体例をあげると、デ－タ作成日やデ－タ作成者などが挙げられます。
また、解答に含まれているdictionary(ディクショナリー)は「辞書」という意味の英単語になっています。
メタデ－タはデ－タを検索したり、デ－タを特定したりするので、メタデータを管理することによって辞書のように使用することが出来るようになることからデータディクショナリといわれています。

問題6

経営者の意思決定を支えるためにテ－マを決めて現在、過去のデータを蓄積したもの

データウェアハウスが正解です

データディクショナリはメタデータを効率よく管理すること、データマートは検索効率を上げるためのデータ加工です。

問題7

複数データの内容をつなげること

2相コミットメントが正解です

Commitment(コミットメント)は「(時間､資源を)投入する」という英単語です。
2相コミットメントのことを短くしてコミットすると呼ばれることあり、デ－タが複数箇所にある場合によく使われます。

問題8

デ-タベ－ス管理者の役割はデ－タベ－スの何設計をすることか

物理設計が正解です

論理設計はデ－タ管理者の役割です。

問題9

デ－タ管理者の役割はデ－タベ－スの何設計か

論理設計が正解です

物理設計はデ-タベ－ス管理者の役割です。

問題10

いつのデータを復帰するかを示したもの

目標復旧時点が正解です

目標復旧時点は英語表記でRecovery Point Objectiveやその頭文字を取ったRPOの形で記載されることもあるので対応出来るようにしておきましょう。
ちなみに、Recovery(リカバリー)は「復旧」、 Point(ポイント)が「点」､ Objectiveは「目標」という意味があるので、解答の通りの意味になります。

問題11

復旧にかける時間

目標復旧時間が正解です

目標復旧時間は英語表記でRecovery Time Objectiveやその頭文字を取ったRTOの形で記載されることもあるので対応出来るようにしておきましょう。
ちなみに、Recovery(リカバリー)は「復旧」、 Time(タイム)が「時間」､ Objectiveは「目標」という意味があるので、解答の通りの意味になります。
また、他の選択肢の目標復旧時点はいつのデータを復帰するかを示したものです。

問題12

ロールバックとロールフォワードの内で、更新前の情報で回復するのはどちらか

ロールバックが正解です

Back(バック)は「後ろに戻る」、foward(フォワード)は「前身する」という意味をそれぞれ持つ英単語です。
そのため、ロ－ふバックは更新前の戻った状態にデ－タを書き直し、ロールフォワードは更新よりも後のデ－タの作成が進んだ状態で回復します。

問題13

データを詳細化すること

ドリルダウンが正解です

トリルダウンはdorill downと英語では表記されます。ドリルを用いて土を掘っていく様子が転じて掘り下げて理解することという意味になっています。
もう片方の選択肢のロールアップはデータを全体化することです。

問題14

参照する値は存在しないといけないことは何制約か

参照制約が正解です

データやプログラムの規模が大きくなってくると、データを複数に分けて取り扱うことが多くなります。データを複数に分けると、データ同士の参照の関係や、データの制約など。考慮しなければいけないことが増えていきます。
2つのデータがあって、別のデータを引用してデータをいれる値は当然表に直接好き勝手なデータを入れたら分けわからないことになることは予想できます。そのため、引用先には引用元に関係ないデータをあらかじめ入れられないようにことを参照制約と呼ばれています。
なお、一意性制約は全く同じデータを複数登録することができないという制約です。

問題15

キ－属性によって保存する場所を変えること

キ－レンジ分割方式が正解です

Key(キ－)は「鍵」Range(レンジ)には「幅」という意味があります。
デ－タべ－スにおいてキ－は他のデ－タの質をあげるために使用されるデ－タの値をさします。(他のデ－タから見たら「鍵」のような働きをするのでキ－と呼ばれています)
また、もう一つの選択肢である論理設計はデ－タ管理者が行う設計です。

問題16

データをどのような形式で格納するかを定めたもの

内部スキ－マが正解です

Schema(スキ－マ)とは「図式、図解」という意味を表す英単語です。
ここでの内部とは「利用者に見えることの無いデ－タ構造」が挙げられます。
(同じ一つの処理に対して取りうる処理は複数パターンありうるため、公開しない限りデ－タ構造は不明であるため)
そのため、内部のデ－タ構造について整理できるように示した図が内部スキ－マと呼ばれています。
また、内部スキ－マの例としてはインデックスの作成やデ－タの整理などが挙げられるので、合わせて押さえておきましょう。

問題17

別名ビューとも呼ばれる、データの利用者からの見方を記述したものはどれか

外部スキ－マが正解です

Schema(スキ－マ)とは「図式、図解」という意味を表す英単語です。
ここでの外部とは「利用者に見える部分」のことを示しています。そのため、利用者の普段使いから見たシステムやデ－タの構造を示したものが外部スキ－マとされています。
実際に仕事なんかでデ－タベ－スを扱うとなると、デ－タベ－ス取り扱いソフトでは外部スキ－マという言葉より、ビューと表記されることの方が多いので、ビューと言われても意味が結びつくようにしておきましょう。

問題18

業務内容とデータの中身を記載したもの

概念スキ－マが正解です

Schema(スキ－マ)とは「図式、図解」という意味を表す英単語です。
オブジェクト指向と呼ばれるプログラムの作成方法では、業務の中身どそれに対応するデ－タが重要と言われており、極端な話その2つさえはっきりとしていればプログラムは作成できるとされています。
業務の中身どそれに対応するデ－タ作成するプログラムの概要になることから、概念スキ－マと呼ばれています。
内部スキ－マはデータをどのような形式で格納するかを定めたもの,外部スキ－マはビューともよばれ、データ利用者からの見方を記述したものです。

問題19

内部スキ－マ設計の例に当てはまらないものはどれか

表の正規化が正解です

Schema(スキ－マ)とは「図式、図解」という意味を表す英単語です。
内部スキ－マはデータをどのような形式で格納するかを定めたものであるので、ファイル構成に関するファイル整理、インデックス作成の二つがデータベースに当てはまります。表の正規化は概念スキ－マ設計の例です。

問題20

概念スキ－マ設計の例に当てはまらないものはどれか

インデックス作成が正解です

概念スキ－マは業務内容,データの中身を記載したものであるので、概念スキ－マ設計は1ファイルの中身のデータがどうなっているかを分かりやすくしているもの、つまり表の正規化、ER図の作成の二つです。インデックス作成は内部スキーマ設計の例です。
なおスキーマ設計にミスが起ると、機械処理をする際に参照するデータが噛み合わなくなってデータの修理をする。なんてことになります。

問題21

表の正規化のメリットに当てはまらないものは

表の可読性が上がるが正解です

表の正規化をすることで、重複更新を避けられるようになるため、更新しやすくなります。
エクセルを用いて表から正規化したデータベースを作成しようとした場合、結合してあるセルの結合は解除して、もとから結合してあった範囲のセルに全て同じ値を入れ直さないといけなくなるので、必ずしも人間が一目みたときの表の可読性が上がるとは限りません。(機械にとっては見やすい情報になっているので、検索性能は上がっています。)

問題22

主キ－の一部の値が決定すれば、自動的に表中の値が決まる関係

部分関数従属が正解です

完全関数従属性は主キ－の全ての値が決定して初めて、自動的に表中が決定する関係です。推移的関数従属は主キ－出ない部分の列の値が決定すると、自動的に別の列の値も決定する関係です。

問題23

主キ－の全ての値が決定して初めて、自動的に表中が決定する関係

完全関数従属性が正解です

部分関数従属は主キ－の一部の値が決定すれば、自動的に表中の値が決まる関係、推移的関数従属は主キ－出ない部分の列の値が決定すると、自動的に別の列の値も決定する関係です。

問題24

主キ－出ない部分の列の値が決定すると、自動的に別の列の値も決定する関係

推移的関数従属が正解です

完全関数従属性は主キ－の全ての値が決定して初めて、自動的に表中が決定する関係、部分関数従属は主キ－の一部の値が決定すれば、自動的に表中の値が決まる関係です

問題25

第一次正規形の条件

繰り返し属性が存在しないが正解です

デ－タベ－スの取扱において正規化されているとは機械が複数あるデ－タから欲しいデ－タを検索出来るようなデ－タの形に整えることを言います。
最低限検索出来れば(第一)正規化されているとはいえますが、より機械が効率よく検索しやすいデ－タの形にするごとに第二正規化、第三正規化と呼ばれています。
繰り返し属性というとかなりイメージしにくいですが、セルの結合によって各列のセルの大きさがバラバラになっている表の状態と考えるとまだイメージしやすいです。
(例,1列目の行の名前は2行をひとまとめに結合しているけど、2行目に入る数字セルの結合がされていない状態)
なお、他の選択肢は第二正規化以降の効率よく検索するための基準です。

問題26

第二次正規形の条件

主キ－に関数従属する属性が存在しないが正解です

正規化とはパソコンがデ－タの検索を出来る状態にすることことを指します。
第二次正規系以降は数字が上がるに連れて、検索効率が良くなっていきます。デ－タは主キ－と呼ばれるセルの値を用いて検索を行い、主キ－に設定する列が少ない方が該当するデ－タを探しやすくなります。
「主キ－に関数従属する属性」とは要は無駄な主キ－のことを指しており意味のない列を主キ－に設定しないことが第二次正規系の条件とされています。

問題27

第三次正規形の条件はどれか

主キ－からの推移的関数従属がないが正解です

各選択肢の意味を翻訳すると以下の通りです。

繰り返し属性が存在しない=デ－タのファイルを揃える
主キ－からの推移的関数従属がない=少ない列で行を識別できるようにする
主キ－からの推移的関数従属がない=表を作るときに意味もなく列を多くしない。列が多くなりそうなら複数の表に分割する。

デ－タにおける正規的であるとは、機械の検索機能を使えることであり、第一次、第二次と数字が上がっていくにつれて、機械の検索効率が良くなります。
まず、デ－タの大きさがバラバラだったらそもそも検索出来ないので「繰り返し属性が存在しない」は(第一次)正規的であるかの条件と予想できます。
残りの二つがややこしいですが、「一つの表を見やすくする」を行ってから「表を分割する」を行う方がデ－タを整理しやすいため、「表を分割する」に該当する「主キ－からの推移的関数従属がない」が第三次正規化にあたると私は理解しています。

問題28

主キ－の候補となりうるキ－

候補キーが正解です

Key(キ－)は「鍵」という意味を示す英単語で、デ－タベ－スの表では特殊な列のことを表しています。
その中でも主キ－は行を識別するために使用する列のことです。しかし、主キ－となりうるものは必ず1つとは限りません
例:クラスの名簿では、出席番号でも、名前でも誰のことを言っているのか識別できる。
そのため、例のような場合では、どちらか一つを主キ－に定めて運用されることが多いので、二つが主キ－の候補であることから候補キーと呼ばれています。
また、もうひとつの選択肢の外部キーは他の表を参照するために設定される属性です。