MENU

Data Driven Knowledgebase

回帰モデルの評価指標を徹底解説

2026年2月10日

R²、MAPE、MAE、RMSEについて、意味・解釈・使いどころを整理して解説します

目次

1. はじめに

回帰モデルを作ったら、次に重要なのが「評価」です。評価指標は、モデルの精度を数値化し、特徴量エンジニアリングやパラメータ調整によって本当に改善したかを判断するために使います。
回帰では R²、MAPE、MAE、RMSE などがよく使われますが、それぞれが何を評価している指標なのかを十分に理解しないまま、慣習的に使われているケースも少なくありません。指標ごとに「何を良いとするか」は異なるため、目的に合わない指標を選ぶと判断を誤ることがあります。
本記事では、代表的な評価指標について、意味・解釈・使いどころを整理して解説します。

2. 評価指標一覧

回帰モデルでは、「どれくらい当たっているか」を一つの数値で表すために評価指標を用います。

代表的な指標には、以下のようなものがあります。

重要なのは、「どの指標が一番優れているか」ではなく、「目的に合った指標を選べているか」です。以降では、それぞれの指標について「意味」「解釈」「使いどころ」を整理していきます。

3. MAPE（Mean Absolute Percentage Error）

MAPEは、実測値に対して平均で何％ずれているかを表す指標です。

どう解釈するか

たとえば MAPE = 20% の場合、「このモデルの予測は、実測値に対して平均で20%程度ずれている」と解釈できます。このように、割合で説明できるため、ビジネス担当者にも非常に伝えやすいのが特徴です。

一般的な目安としては以下のように使われることが多いです。

メリット

「平均で何％外れているか」が直感的
スケールに依存せず、異なるモデル同士の比較がしやすい
需要予測・売上予測などでよく使われる

注意点

実測値が 0 または 0 に近い場合に不安定
小さな実測値に対する誤差を過大評価しやすい
マイナス値を含むターゲットには基本的に不向き

✅ 「説明しやすさ重視」の場面では有力だが、万能ではない指標です。

4. MAE（Mean Absolute Error）

MAEは、予測値と実測値のズレの絶対値を平均したものです。

どう解釈するか

たとえば MAE = 5 の場合、
「このモデルは平均すると5（個・円など）分ずれている」
と解釈できます。
MAPEと違い、ターゲットと同じ単位で誤差を把握できるのが特徴です。

実務での使い方

平均販売数が100個で MAE = 5 → 平均5%程度の誤差
「±10個までなら問題ない」といった業務要件と直接比較できる

メリット

単位がそのままで分かりやすい
外れ値の影響を受けにくく、安定した指標
ビジネス判断と結びつけやすい

注意点

スケールが異なるタスク同士の直接比較には向かない
大きな誤差を特別に重視したい場合には不十分なこともある

✅ 「平均でどれくらいズレるか」を素直に知りたい場合の基本指標です。

5. RMSE（Root Mean Square Error）

RMSEは、誤差を二乗して平均し、その平方根を取った指標です。

どう解釈するか

単位はMAEと同じですが、大きな誤差をより強く評価します。

MAE ≒ RMSE → 大きな外れ値が少ない
RMSE ≫ MAE → 一部で大きな外れが発生している

といった読み取りが可能です。

メリット

大きな誤差を強くペナルティできる
回帰問題で広く使われる標準的指標
最適化やモデル比較に向いている

注意点

外れ値に敏感
ビジネス担当者には直感的に伝わりにくい場合がある

✅ 「大きな予測ミスを特に避けたい」場面で有効な指標です。

6. 決定係数 R²

R²は、モデルがターゲットのばらつきをどれだけ説明できているかを表します。

どう解釈するか

R² = 0.7 → データのばらつきの70%をモデルが説明
R² = 0 → 平均値予測と同レベル
負の値 → 平均予測より悪い

一般的な目安は以下の通りです。

メリット

モデル全体の説明力を一目で把握できる
他モデルとの比較がしやすい

注意点

誤差の大きさ自体は分からない
高いR²でも、業務的に許容できない誤差が出ることがある
特徴量を増やすだけで上がりやすい

✅ 指標上では「良さそう」に見えても、必ずMAEやRMSEと併用すべき指標です。

7. まとめ

評価指標は、モデルの良し悪しを一面的に判断するためのものではありません。

✅ ビジネス説明重視 → MAPE

✅ 平均的なズレを把握 → MAE

✅ 大きなミスを避けたい → RMSE

✅ モデル全体の説明力 → R²

というように、目的・相手・判断基準によって使い分けることが重要です。

特に実務では、「R²は高いが、MAEを見ると業務的に使えない」といったケースも珍しくありません。

評価指標を正しく理解し、「数字の意味を説明できる状態」になることが、機械学習を使える技術にする第一歩と言えるでしょう。

URLをコピーしました！

URLをコピーしました！

この記事を書いた人