DS検定

データサイエンス力

数学的理解

データの理解・検証

予測

最小二乗法と最尤法
こたえ:

最小二乗法: y = ax + b において、y と ax + b の差 (残差) の二乗がもっとも小さくなる a と b を求めること。
最尤法: よくわからないが、確率的に特定のデータがいちばん出やすい場合を探すこと。
重回帰分析、偏回帰係数、標準偏回帰係数、重相関係数
こたえ:

重回帰分析: 複数の説明変数でひとつの目的変数を予測する。y = ax + bx + cx + d。
偏回帰係数: a のこと。
標準偏回帰係数: 標準化したあとの a のこと。
重相関係数: 目的変数の実測値と予測値の相関係数。
混合行列、実測値と予測値の組み合わせ
こたえ:

混合行列: 正誤分布のクロス表。
True Positive: 正解だと予測して、実際に正解である。
True Negative: 不正解だと予測して、実際に不正解である。
False Positive: 正解だと予測したが、実際には不正解である。
False Negative: 不正解だと予想したが、実際には正解である。
正解率、適合率、再現率、F 値
こたえ:

正解率: (TP + TN) / ALL
適合率: TP / (TP + FP)
再現率: TP / (TP + FN)
F 値: (2 * 適合率 * 再現率) / (適合率 + 再現率)
ROC と AUC
こたえ:

ROC: Receiver Operating Characteristic の略。グループ分けの精度を (0, 0) と (1, 1) を通る曲線で表したもの。
AUC: Area Under the Curve の略。ROC 曲線の下側の面積。
RMSE と MAE と MAPE
こたえ:

RMSE: Root Mean Squared Error の略。平均平方二乗誤差。
MAE: Mean Absolute Error の略。平均絶対誤差。
MAPE: Mean Absolute Percentage Error の略。平均絶対誤差率。

科学的解析の基礎

グルーピング

サンプリング

データ加工

データ可視化

モデル化

自然言語処理

画像・映像認識

パターン発見

データエンジニアリング力

環境構築

データ収集

データ構造

データ蓄積

プログラミング

IT セキュリティ

AI システム運用

ビジネス力

行動規範

仮名加工情報と匿名加工情報
こたえ:

仮名加工情報: 個人情報を個人識別不可能にしたもの。ただし、ほかの情報と照合すれば復元可能。
匿名加工情報: 個人情報を個別識別不可能にしたもの。ほかの情報と照合しても復元不可能。
オプトインとオプトアウト
こたえ:

オプトイン: 事前に通知すれば、個人情報を第三者に提供できるという制度。opt in (参加する)。
オプトアウト: 一定の条件を満たせば、本人の許可なしに個人情報を第三者に提供できるという制度。opt out (取りやめる、管理から離れ独立する)。
一次情報、二次情報、三次情報
こたえ:

一次情報: 実際にデータ収集した情報。Web クローリングによる情報収集は一次扱い。
二次情報: 他者から得た情報、一次情報をもとに編集された情報。
三次情報: 情報源がわからない情報。
GAN と VAE
こたえ:

GAN: Generative Adversarial Network の略。敵対的生成ネットワーク。本物の画像とフェイク画像を競い合わせて学習させる。
VAE: Variational AutoEncoder の略。未知のデータを確率的に生成する。こちらも画像生成に使われる。

論理的思考

スコーピング