予測の "下限ベンチマーク" — 月次 JEPX を単純モデル4種で当てる
「予測モデルが優れているか」を判定するには、何と比べるかが肝になる。「正解率 80% です」と言われても、コイン投げで 50% なのか、サイコロで 17% なのかで、80% の偉さは全く違う。電力価格の予測でも同じ問題が立つ。
ここでは、できるだけ単純な 4 つのベースラインで月次 JEPX 東京の価格を予測してみる。これより複雑な予測モデル(#70 の重回帰、機械学習、Yes Energy のような業界モデル)が本当に意味のある改善をもたらすのか、を測る "ものさし" を作るのが目的である。
1. 設定
- 対象: JEPX 東京 月平均価格(円/kWh)
- 訓練期間: 2012-04 〜 2021-12(10 年)
- テスト期間(out-of-sample): 2022-01 〜 2026-04(52 ヶ月)
- 評価指標: MAE(平均絶対誤差、円/kWh)・RMSE・MAPE(平均絶対パーセント誤差、%)
ここでの「予測」は、ある月 t の価格を、それより前の情報だけで当てる事後評価である。実際の未来予測ではなく、過去データを使った "もしこのモデルだったらどれくらい当たっていたか" の検証である。
2. 4 つのベースライン
いずれもパラメータほぼゼロ、誰でも頭の中で計算できる類のモデル:
| モデル | 式 | 直感 | |---|---|---| | 持続予測(lag1) | y_hat(t) = y(t−1) | 「来月も今月と同じ」 | | 季節平均 | y_hat(t) = 過去すべての同月の平均 | 「夏は夏、冬は冬で似た値段」 | | 12 ヶ月前同値(lag12) | y_hat(t) = y(t−12) | 「去年の同じ月と同じ」 | | 訓練期間平均(定数) | y_hat(t) = 訓練期間の単純平均(11.88 円/kWh) | 「いつもだいたい 12 円くらい」 |
3. 結果
| モデル | MAE | RMSE | MAPE | |---|---:|---:|---:| | 持続予測(lag1) | 2.02 円/kWh | 2.91 | 11.94% | | 季節平均(同月過去平均) | 4.74 | 7.50 | 23.54% | | 12 ヶ月前同値(lag12) | 8.50 | 12.04 | 49.77% | | 訓練期間平均(定数) | 4.74 | 7.39 | 22.46% |
参考:訓練期間平均 = 11.88 円/kWh、テスト期間実績平均 = 16.14 円/kWh(2022 年以降に構造的な水準シフト)。
持続予測の誤差分布(n=52):
- 中央値誤差:−0.21 円/kWh(ほぼバイアスなし)
- ±2 円/kWh 以内:65.4%(34/52 ヶ月)
- ±5 円/kWh 以内:88.5%(46/52 ヶ月)
- 最大過小(実 < 予測):−9.11 円/kWh(2022-04)
- 最大過大(実 > 予測):+7.40 円/kWh(2022-03)
最大誤差は 2022 年 3〜4 月に集中している。ロシアのウクライナ侵攻後の LNG 急騰で JEPX が一気に上振れ → 翌月反動で下振れ、という構造変化のタイミングで、「前月と同じ」予測は当然ながら無力になる。
4. 読み取り
4.1 「前月と同じ」が圧倒的最良という事実
4 モデル中、持続予測(lag1)が最良で MAPE 11.94%。次点の季節平均と訓練期間平均は MAPE 22〜23% で約 2 倍の誤差、12 ヶ月前同値に至っては MAPE 49.77% で約 4 倍。
月次価格は「先月と似ている」という時系列の慣性が極めて強い。これは #70 JEPX 月次回帰分析 で、5 変数の重回帰 R² が 0.883 だが前月価格 1 変数だけでも R² が 0.834だった発見と完全に整合する。同じ事実を、in-sample(当てはまり)と out-of-sample(予測誤差)の両側から見ている。
4.2 季節平均が壊滅的に効かないのはなぜか
電力価格は気温だけで決まらない。燃料コスト・為替・政策・原発稼働状況・電源構成で大きく動く。たとえば「過去 10 年の 3 月の平均」を取っても、2022 年 3 月の急騰(LNG ショック直撃)には全く追従できない。「電力価格は季節商品である」という素朴な仮定はデータが否定する。
4.3 12 ヶ月前同値が最悪の理由
これは構造変化に最も脆いモデル。2022 年は 2021 年と「同じ世界」ではなかった(ウクライナ・LNG・円安)。「去年の同月」予測の MAPE 49.77% は、**「2022 年以降の世界は 2021 年以前とは別物」**ということをデータが叫んでいる。
4.4 構造的水準シフトと「定数モデル」の限界
訓練期間(2012-2021)の平均 11.88 円/kWh で「いつも 12 円くらい」と予測すると、テスト期間(2022 年以降、実績平均 16.14 円/kWh)では約 4 円も低く出続ける。過去の平均は未来の平均ではない。これは予測モデル設計の最も基本的な落とし穴である。
5. Yes Energy「2%」との比較について
米 Yes Energy 社は電力需要の日次予測で「誤差約 2%」をベンチマークとして公開している。本記事の MAPE 11.94% と直接比較はできない:
- Yes Energy = 日次予測の需要量、本記事 = 月次予測の価格
- 一般に日次の需要は気象データ + 過去パターンで高精度に当たる(短期・量的)
- 月次の価格は構造変化が支配(中期・複雑)
ただし「シンプルな代理モデルでベースラインを引く」という方法論は共通している。MAPE 11.94% は「月次価格の持続予測の限界精度」を示す下限ベンチマークとして、他のモデルを評価する基準になる。
6. 教訓 4 つ
- モデルを評価する前に "単純ベースライン" を作る。これより上回らないモデルは存在意義が薄い。
- 持続予測(前月と同じ)は月次データで強力。これより 1%pt MAPE を縮めるだけでも価値があるのが時系列予測の世界。
- 季節平均・年同月モデルは要注意。構造変化があると一気に外れる。
- R²(in-sample)と MAPE(out-of-sample)は別物。同じデータでも、評価視点を変えると違う側面が見える。#70 は前者、本記事は後者。
7. これは未来予測ではない
すべての結果は過去 52 ヶ月の out-of-sample 検証であり、来月の JEPX 価格を予測するものではない。実取引・運用判断には、専門家による精緻な日次・時間次モデル(Yes Energy のような)と複数シナリオ分析が必要です。本記事は「予測精度を測る方法論」を読者が自分で再現できる状態にすることを目指しています。
関連 Insight
- JEPX 東京 月次価格の回帰分析 → 同じ JEPX 東京を in-sample 回帰(前月価格 1 変数だけで R²=0.834)で見た方法論ライブラリ Day 1 の姉妹編。本記事の out-of-sample 検証と表裏一体(#70)
- 電力の "休んでいる日" → 休日(GW・盆・年末年始)の需要凹みは持続予測の誤差源の一つ。同じ JEPX 東京を休日窓で読む方法論ライブラリ Day 2(#71)
8. 出典
- JEPX 東京 スポット価格:JEPX 公表値、
jepx-terms準拠 - 編集物(本記事の解説・誤差計算):CC BY 4.0(EIC Data)
構成系列: jepx-spot-tokyo(日次、月平均に集計)/レンダラ: ChartLine ×1、4 モデル評価・持続予測の誤差分布は markdown 表で透明開示
編集物著作権: EIC Data (CC BY 4.0)
📋 引用形式コピー
License: CC BY 4.0 / accessed_at は自動補完@misc{eic-data-forecast-error-baseline-jepx,
title = {予測の "下限ベンチマーク" — 月次 JEPX を単純モデル4種で当てる (forecast-error-baseline-jepx)},
author = {EIC Data (一般社団法人エネルギー情報センター)},
year = {2026},
url = {https://data.eic-jp.org/insight/forecast-error-baseline-jepx},
note = {Accessed: 2026-06-04; License: CC BY 4.0},
publisher = {EIC Data}
}💬 リーダーコメント
GitHub Issues 連動 (全コメント一覧)コメント投稿には GitHub アカウントが必要。投稿は kenjieda-eng/eic-data-web リポジトリの Issue (label: comment) として保存され、誰でも閲覧できます。
コメント欄を読み込み中…
続報を週次で受け取る
EIC Data の Insight 新着 + JEPX 特異日 + 用語集新項目を、毎週土曜朝にお届けします。