thumbnail 一問一答の一歩

問題1

複数あるデータを探しやすいように整理したものは何と呼ばれるか

データベースが正解です

データは小規模であればエクセル、プログラムで使用する場合では構造体や配列を使用することで事足ります。しかし、データの量が大きくなり、大規模になってくると、データベースを設計する専用のツールを用いてデータを管理する必要が出てきます。
ちなみに、データベースを使うことによるメリットは、検索機能を使用することができるので、データを見つけやすくなる、機械処理がしやすくなることです。また、デメリットはセルの結合ができないのでぱっと見で表が見づらくなる点、表が分散することからデータの構造を理解することが大変になる点があげられます。
また、データディクショナリはメタデータを効率よく管理すること、ちなみにデータマートは検索効率を上げるためにデータ加工をすることです。

問題2

有用なデータを取り出すこと

データマイニングが正解です

mining(マイニング)には発掘するという意味があります。
本来は埋もれた古いものを見つけ出すという意味がありますが、デ-タベ-スは大抵複雑に入り組んでいるため、見きれないほどたくさんあるデ-タから欲しいデ-タを取り出すことは効率化に大きな意味を持ちます。
データディクショナリはメタデータを効率よく管理すること、データクレンジングはデータを一体系に統一することです。

問題3

データを一体系に統一すること

データクレンジングが正解です

Cleansing(クレンジング)はClean(クリ-ン)という「綺麗にする」という意味が派生した単語であり、元の単語と似たような意味を持ちます。
また、学校の水道の掃除に似た「クレンザー」が響きも意味も似ているので、そちらと関連させて理解するのも問題ないです。
デ-タクレンジングはデ-タを整理する方法の一つであり、デ-タの体系を統一することで、人間が理解しやすくなったり、デ-タを探しやすくなるというメリットがあります。

問題4

検索効率を上げるためにデータ加工をすること

データマートが正解です

Mart(マート)は「市場」という意味の英単語です。
市場に売られているものは見えない工夫がたくさんなされており、その結果としてより注目されて、売れやすくなるようになっています。
それと同じように、検索ですぐ現れて、使われやすくなるようにデ-タを加工することはデ-タマ-トと呼ばれています。

問題5

大量のデータをそのままの形で保存されたもの

データレイクが正解です

Lake(レイク)は「池」という意味があります。
デ-タベ-スを作成するほどのデ-タ量となってくると、加工してから入れるというのは大変なので、とりあえず入れておくということが発生します。それは、デ-タ の池のように見えることからデ-タレイクと呼ばれています。

問題6

メタデータを効率よく管理すること

データディクショナリが正解です

問題文中に出てきたメタデ-タとはデ-タに関するデ-タのことを指しています。具体例をあげると、デ-タ作成日やデ-タ作成者などが挙げられます。
また、解答に含まれているdictionary(ディクショナリー)は「辞書」という意味の英単語になっています。
メタデ-タはデ-タを検索したり、デ-タを特定したりするので、メタデータを管理することによって辞書のように使用することが出来るようになることからデータディクショナリといわれています。

問題7

経営者の意思決定を支えるためにテ-マを決めて現在、過去のデータを蓄積したもの

データウェアハウスが正解です

データディクショナリはメタデータを効率よく管理すること、データマートは検索効率を上げるためのデータ加工です。

問題8

複数データの内容をつなげること

2相コミットメントが正解です

Commitment(コミットメント)は「(時間、資源を)投入する」という英単語です。
2相コミットメントのことを短くしてコミットすると呼ばれることあり、デ-タが複数箇所にある場合によく使われます。

問題9

検索しやすく索引をつけること

スタースキーマが正解です

Schema(スキ-マ)とは「図式、図解」という意味を表す英単語です。
キ-レンジ分割方式はキ-属性によって保存する場所を変えること、データディクショナリはメタデータを効率よく管理することです。

問題10

デ-タベ-ス管理者の役割はデ-タベ-スの何設計をすることか

物理設計が正解です

論理設計はデ-タ管理者の役割です。

問題11

デ-タ管理者の役割はデ-タベ-スの何設計か

論理設計が正解です

物理設計はデ-タベ-ス管理者の役割です。

問題12

いつのデータを復帰するかを示したもの

目標復旧時点が正解です

目標復旧時点は英語表記でRecovery Point Objectiveやその頭文字を取ったRPOの形で記載されることもあるので対応出来るようにしておきましょう。
ちなみに、Recovery(リカバリー)は「復旧」、 Point(ポイント)が「点」、 Objectiveは「目標」という意味があるので、解答の通りの意味になります。

問題13

復旧にかける時間

目標復旧時間が正解です

目標復旧時間は英語表記でRecovery Time Objectiveやその頭文字を取ったRTOの形で記載されることもあるので対応出来るようにしておきましょう。
ちなみに、Recovery(リカバリー)は「復旧」、 Time(タイム)が「時間」、 Objectiveは「目標」という意味があるので、解答の通りの意味になります。
また、他の選択肢の目標復旧時点はいつのデータを復帰するかを示したものです。

問題14

ロールバックとロールフォワードの内で、更新前の情報で回復するのはどちらか

ロールバックが正解です

Back(バック)は「後ろに戻る」、foward(フォワード)は「前身する」という意味をそれぞれ持つ英単語です。
そのため、ロ-ふバックは更新前の戻った状態にデ-タを書き直し、ロールフォワードは更新よりも後のデ-タの作成が進んだ状態で回復します。

問題15

データを詳細化すること

ドリルダウンが正解です

トリルダウンはdorill downと英語では表記されます。ドリルを用いて土を掘っていく様子が転じて掘り下げて理解することという意味になっています。
もう片方の選択肢のロールアップはデータを全体化することです。

問題16

参照する値は存在しないといけないことは何制約か

参照制約が正解です

データやプログラムの規模が大きくなってくると、データを複数に分けて取り扱うことが多くなります。データを複数に分けると、データ同士の参照の関係や、データの制約など。考慮しなければいけないことが増えていきます。
2つのデータがあって、別のデータを引用してデータをいれる値は当然表に直接好き勝手なデータを入れたら分けわからないことになることは予想できます。そのため、引用先には引用元に関係ないデータをあらかじめ入れられないようにことを参照制約と呼ばれています。
なお、一意性制約は全く同じデータを複数登録することができないという制約です。

問題17

キ-属性によって保存する場所を変えること

キ-レンジ分割方式が正解です

Key(キ-)は「鍵」Range(レンジ)には「幅」という意味があります。
デ-タべ-スにおいてキ-は他のデ-タの質をあげるために使用されるデ-タの値をさします。(他のデ-タから見たら「鍵」のような働きをするのでキ-と呼ばれています)
また、もう一つの選択肢である論理設計はデ-タ管理者が行う設計です。

問題18

データをどのような形式で格納するかを定めたもの

内部スキ-マが正解です

Schema(スキ-マ)とは「図式、図解」という意味を表す英単語です。
ここでの内部とは「利用者に見えることの無いデ-タ構造」が挙げられます。
(同じ一つの処理に対して取りうる処理は複数パターンありうるため、公開しない限りデ-タ構造は不明であるため)
そのため、内部のデ-タ構造について整理できるように示した図が内部スキ-マと呼ばれています。
また、内部スキ-マの例としてはインデックスの作成やデ-タの整理などが挙げられるので、合わせて押さえておきましょう。

問題19

別名ビューとも呼ばれる、データの利用者からの見方を記述したものはどれか

外部スキ-マが正解です

Schema(スキ-マ)とは「図式、図解」という意味を表す英単語です。
ここでの外部とは「利用者に見える部分」のことを示しています。そのため、利用者の普段使いから見たシステムやデ-タの構造を示したものが外部スキ-マとされています。
実際に仕事なんかでデ-タベ-スを扱うとなると、デ-タベ-ス取り扱いソフトでは外部スキ-マという言葉より、ビューと表記されることの方が多いので、ビューと言われても意味が結びつくようにしておきましょう。

問題20

業務内容とデータの中身を記載したもの

概念スキ-マが正解です

Schema(スキ-マ)とは「図式、図解」という意味を表す英単語です。
オブジェクト指向と呼ばれるプログラムの作成方法では、業務の中身どそれに対応するデ-タが重要と言われており、極端な話その2つさえはっきりとしていればプログラムは作成できるとされています。
業務の中身どそれに対応するデ-タ作成するプログラムの概要になることから、概念スキ-マと呼ばれています。
内部スキ-マはデータをどのような形式で格納するかを定めたもの,外部スキ-マはビューともよばれ、データ利用者からの見方を記述したものです。

問題21

関連するデータを矢印で繋いでいくデータ

ネットワーク型データベ-スが正解です

Network(ネットワーク)には「他のと繋がり」という意味があります。そのため、関連する要素同士の繋がりを示しているので、ネットワーク型データベ-スと呼ばれています。
関係データベ-スはデータの集合を2次元の表で表現することです。また、キ-バリュー型データベ-スはキ-と値の組を単位としてデータを格納するNOSQLのデータベ-スです。

問題22

データの集合を2次元の表で表現すること

関係データベ-スが正解です

関係データベ-スはいわゆる表の形式をとったデ-タべ-スなので、縦と横という2つの関係性が分かりやすいといえます。
デ-タべ-スといえば、大体は表の形をしたものが多く、一番メジャーなデ-タべ-スの型であるといえます。

問題23

キ-と値の組を単位としてデータを格納するNOSQLのデータベ-ス

キ-バリュー型データベ-スが正解です

Key(キ-)は「鍵」、value(バリュー)は「値」という意味を表す英単語です。
デ-タべ-スにおいてキ-は他のデ-タに影響を及ぼすことから、デ-タの品質をあげる鍵のような働きをするものを指します。
デ-タの値(value)を利用してデ-タを識別する特徴からキ-バリュー型データベ-スと呼ばれています。

問題24

B+木インデックスのデータのうち、検索出来ない条件に当てはまるものはどちらか

両方が正解です

コンピュータ理論における木はtree(ツリー)とも呼ばれており、各デ-タに番号をつけた上で番号の大小関係を用いてデ-タを効率よく検索するためのデ-タの整理方法の一つです。
B+木のBはbalance(バランス)の頭文字から取られています。具体的には基準となる数字よりも大きいものと小さいものが常に同じになるように設定されます。
Index(インデックス)は「目録」という意味を持つ英単語であり、先程の基準の数字のことをさしています。
B+木インデックスのデータのうち、検索条件として出来ない条件は大小関係が確定しない否定を含む検索条件、及び大小関係が定義されていないNULLを含む検索条件の二つです。

問題25

SQL以外の方法でもデータにアクセスすることの出来るデータ管理方法

Not Only SQLが正解です

Notは否定語,Onlyは「~のみ」という意味を意味します。
表形式になっているデ-タを効率よく扱うことの出来るプログラム言語の一つとして、SQLがあります。そして、現在では大規模デ-タを扱うにはSQLが主流になっています。しかし、SQL以外にもデ-タを閲覧、検索、加工する方法はあり、それらはまとめてNot Only SQLと呼ばれています。
また、他の選択肢であるETLツ-ルはータを抽出して加工し、データベ-スに書き出すツ-ルです。XAMPPはデータベースし使用するシステムの一つです。

問題26

データを抽出して加工し、データベ-スに書き出すツ-ル

ETLツ-ルが正解です

ETLツ-ルはExtract(抽出)、Transration(加工)、Load(読み書き)の3つの頭文字をとった言葉です。
また、Not Only SQLはSQL以外の方法でもデータにアクセスすることの出来るデータ管理方法です。Calcはオープンソースの表計算ソフトウェアの一つです。

問題27

遠隔データベ-スにアクセスする通信規格

Remote Database Acsessが正解です

Remote(リモート)は「遠隔の」,Database(デ-タべ-ス)は大量のデ-タが入っている表,Acsessは「操作できるように繋げること」という意味があります。
デ-タを利用したり改造するには本来デ-タが入っている機器を利用するか物理的に接続するしかなかったのですが、時代の進歩により、遠隔でデ-タに接続出来るようになっています。
ETLツ-ルはデータを抽出して加工し、データベ-スに書き出すツ-ルです。