ホーム / 方法論
方法論(Methodology)
一次出典優先・再現可能・透明な運用を原則とする EIC Data の編集方針。
1. 二層アーキテクチャ
編集層(Editorial Tier, 約 200 指標)と配信層(Distribution Tier, 約 30,000 系列)を分離。編集層は人が一次出典確認・解釈・更新する「文脈つき」データ、配信層は自動収集・機械処理向けのメタデータ中心カタログ。
2. 一次出典・ライセンス
掲載するすべての指標には一次出典(官公庁・市場運営者・取引所・学術機関・企業 IR)を明示する。二次出典のみの場合は編集層に掲載しない。ライセンスは公開 API/CC-BY/政府公表データ等、再配布可能なものを優先する。
3. 実データと参考値
現在、編集層 557 指標のうち 557 指標は一次出典から取得した実データ (実データ)を掲載している。残り 0 指標は UI 検証用の参考値 (参考値)で、β 公開までに順次差し替える。
最新の実データ一覧は 編集指標カタログ を参照。系列ごとの鮮度は データ品質ダッシュボード から確認可能。
4. 更新頻度
各指標は原則として出典のオリジナル公表サイクル(日次・週次・月次・四半期・年次)に従う。毎日 07:00 JST にバッチ更新し、未更新の場合は as-of 日付を維持する。
5. 訂正ポリシー
値に誤りが判明した場合は訂正履歴に記録し、当該指標ページに訂正バナーを掲出する。遡及修正は一次出典に従う。
6. 引用方法
当サイトの数値を論文・記事・社内資料等で引用する場合は、本ページ「8. 引用の作法」記載の citation ID と as-of 日付を併記する。
7. D-011 系列メタデータ・スキーマ(v1)
すべての配信系列は 19 項目 × 3 層 の構造化メタデータを持つ。これにより、研究者が「この系列は引用しても大丈夫か?」を 5 秒で判断できる。現在の状態は データ品質ダッシュボード から確認可能。
| 層 | 項目名 | 説明 |
|---|---|---|
| 必須 | id | 系列の一意識別子(kebab-case、例: jepx-spot-tokyo) |
| 必須 | name | 表示名(日本語、人間可読) |
| 必須 | domain | 12 ドメイン分類(electricity / power / fuel / weather / finance / policy / esg / tech / geo / econ / demand / ir / intl) |
| 必須 | frequency | 公表頻度(30min / daily / weekly / monthly / quarterly / annual) |
| 必須 | unit | 単位(¥/kWh / $/MMBtu / GWh / ℃ / mm / % など) |
| 必須 | source_name | 一次出典の名称(例: 資源エネルギー庁 電力調査統計) |
| 必須 | source_url | 一次出典の URL(クリックで原典に到達できる) |
| 必須 | license | SPDX 識別子(CC-BY-4.0 / public-domain など)または独自識別子(boj-terms / jma-terms など) |
| 必須 | observation_cutoff | 最終確定値の日付(YYYY-MM-DD、データ品質ダッシュボードの SLA 判定に使用) |
| 必須 | updated_at | パイプラインがメタデータを書き出した時刻(ISO 8601) |
| 推奨 | license_url | ライセンス本文の URL |
| 推奨 | license_notice | 利用規約上必要な追加文言(例: 日本銀行 boj-terms の「保証されない」文言) |
| 推奨 | tz | タイムゾーン(Asia/Tokyo / UTC など) |
| 推奨 | missing_policy | 欠損データの扱い(null / forward_fill / interpolate など) |
| 推奨 | backfill_start | バックフィル開始日(系列の歴史的開始点) |
| 任意 | publisher | 出版者(source_name と異なる場合のみ。例: METI vs 資源エネルギー庁) |
| 任意 | aggregation | 集約種別(raw / daily_mean / monthly_sum / derived など、10 種類) |
| 任意 | notes | 編集者向けの注記(例: みなし小売ベース、新電力分は別ブロック) |
| 任意 | depends_on | 派生指標の場合、計算元の indicator id 配列(例: meti-renewables-share) |
実装: 各 fetch_*.py がデータ書き出し時に {id}.metadata.json を生成 → CI が data/catalog/indicators.json にまとめる → 公開層がビルド時に 1 fetch して描画。詳細は source_map.yaml 参照。
8. 引用の作法(Citation Practice)
EIC Data は「引用インフラ」を北極星に掲げる。読者が論文・記事・資料で本サイトの値を引用する際の標準形式と、編集チームが内部で守る作法をここに明示する。
8.1 なぜ "引用の作法" が必要か
日本のエネルギー・金融データは、複数機関が異なる粒度・命名・タイムゾーンで公表しており、孫引きが起きやすい。EIC Data の値を引用する際に (a) 一次出典に到達できる / (b) as-of 日付が明示される / (c) 第三者が再現できる の 3 条件を満たすと、引用された数値の信頼性が読者にも担保される。
8.2 推奨する 3 形式
JEPX 東京エリア 月次平均(2026-03 = ¥12.3/kWh)/ 出典: EIC Data, https://data.eic-jp.org/catalog/jepx-spot-tokyo (as-of 2026-04-29)
EIC Data (2026). "JEPX 東京エリアスポット価格(日次)". 一般社団法人エネルギー情報センター. 取得日 2026-04-29. https://data.eic-jp.org/catalog/jepx-spot-tokyo 一次出典: 日本卸電力取引所 (JEPX) スポット市場価格. https://www.jepx.jp/electricpower/market-data/spot/ ライセンス: jepx-terms(再配布可、原典明示必須)
@misc{eicdata_jepx_tokyo_2026,
author = {{EIC Data / Energy Information Center}},
title = {JEPX 東京エリアスポット価格(日次, 2016--2026)},
year = {2026},
url = {https://data.eic-jp.org/catalog/jepx-spot-tokyo},
note = {accessed 2026-04-29; primary source: JEPX Spot Market},
howpublished = {\url{https://www.jepx.jp/electricpower/market-data/spot/}}
}8.3 引用に必須の 4 要素
- 系列名と単位(例: 「JEPX 東京エリア 月次平均(¥/kWh)」)
- as-of 日付(取得時点の最終確定日、データ品質ダッシュボードの
observation_cutoffと一致) - EIC Data の URL + 一次出典の URL(両方記載、第三者再現性の担保)
- ライセンス識別子(SPDX または独自、再配布可否を読者に示す)
8.4 派生指標(Insight 系)の引用
Insight ページ(複数指標を組み合わせた編集物)を引用する場合は、 (i) Insight slug(例: us-jp-rate-spread-vs-usdjpy) + (ii) 構成系列の indicator id 配列(D-011 の depends_on フィールドと一致)を明示する。編集物としての著作権は EIC Data に帰属(CC BY 4.0)。元データの著作権・ライセンスは各構成系列のメタデータに従う。
8.5 編集チームへの作法(Internal)
- 記事の本文中、または末尾に「出典: 機関名(一次)/ EIC Data」の形式で必ず併記する
- 数値を貼った直後に as-of 日付を必ず添える("2026-03 月次平均"、"2026-04-28 終値" など)
- 派生指標を作るときは、計算式と
depends_on配列を Insight 詳細の「読み方」末尾に明示する
本セクションは Phase B-C の MDX 移植時に独立した /methodology/citation ページに昇格予定。
9. ライセンスの読み解き(License Decoding)
EIC Data の各系列メタデータには license フィールドがあり、SPDX 標準識別子か EIC Data 独自識別子のいずれかが入る。研究者・ジャーナリスト・実務者が引用・再配布前に判断すべきライセンス読み解きの作法をここに整理する。
フッターや本ページ等で表示している「CC BY 4.0」は、EIC Data が自ら制作した編集物(解説・Insight 記事・派生指標・メタデータ・サイトデザイン)に対する適用です。個別データ系列のライセンスは各系列の license フィールドに従い、一律 CC BY 4.0 ではありません。
特に提供元(市場運営者・公的機関)の独自利用規約が適用される系列 (例: eprx-terms / occto-terms / jepx-terms / jma-terms / meti-terms / boj-terms 等)は、 CC BY 4.0 ではなく 当該提供元規約に準拠します。 引用・再配布時は SPDX 識別子(CC-BY-4.0 / public-domain 等)かカスタム規約識別子かを系列ごとに必ず確認してください。
9.1 EIC Data のライセンス哲学
「データ調達にお金を使わない/公開情報のみで構築」を方針化し、すべての系列を「再配布可能なライセンス」または「明示された利用規約に従って引用可能」なものに限定している。商用データベンダー契約はせず、機関固有の利用規約(boj-terms / jepx-terms など)も読者が一次出典を確認できるよう license_url + license_notice をメタデータに必ず付与する。
9.2 SPDX 系識別子(国際標準)
SPDX (Software Package Data Exchange) は OSI / Linux Foundation が管理する標準ライセンス識別子。機械可読で、再配布条件が明確。EIC Data で使用するもの:
| 識別子 | 再配布 | 帰属表示 | 改変 | EIC Data 採用例 |
|---|---|---|---|---|
| CC-BY-4.0 | ✅ 自由 | 必須 | ✅ 自由 | EIC Data 全コンテンツ(自社編集物) |
| CC0-1.0 | ✅ 自由 | 不要 | ✅ 自由 | なし(パブリックドメイン相当) |
| public-domain | ✅ 自由 | 推奨 | ✅ 自由 | 米国 Treasury Daily Yields 4 系列、財務省 国債金利情報 1 系列 |
| MIT / Apache-2.0 | ✅ 自由 | 必須 | ✅ 自由 | なし(コードライブラリ用、データには非採用) |
9.3 独自識別子(機関固有の利用規約)
SPDX に該当しない、機関ごとの独自利用規約を持つ系列のための識別子。 license_url + license_notice でその実態を明示する。
| 識別子 | 該当系列(EIC Data 内) | 利用規約のポイント |
|---|---|---|
| boj-terms | USD/JPY 月次 4 系列(FM08) | 引用時に「日本銀行によって保証されたものではありません」の文言を添える必要あり(license_notice 参照) |
| jepx-terms | JEPX スポット 10 系列 | 非商用・商用とも引用可、原典明示必須。投資判断の責任は利用者 |
| jma-terms | 気象 63 系列(気温・降水量・日照・風速・積雪) | 気象庁ホームページの利用規約に従う、出典明示必須、加工・編集自由 |
| meti-terms | 電源別発電 8 + 需要 3 + 派生 1 = 12 系列 | 経済産業省の二次利用規約に従う、出典明示必須、商用利用可 |
| eprx-terms | 需給調整市場(5 商品 × 約定価格 等) | EPRX(需給調整市場運営者)の公表規約に従う、出典明示必須。CC BY 4.0 ではなく当該規約に準拠 |
| occto-terms | 容量市場メインオークション約定価格(エリア別・全国加重平均) | 電力広域的運営推進機関(OCCTO)公表規約に従う、出典明示必須。CC BY 4.0 ではなく当該規約に準拠 |
| wb-pink-sheet-terms | 燃料 7 系列(LNG / NG / 原油 / 石炭) | World Bank Pink Sheet (CC BY 4.0 相当)、原典明示必須、商用利用可 |
9.4 引用時の併記必須項目
- SPDX (CC-BY-4.0 / public-domain): ライセンス識別子 + 一次出典 URL のみで十分
- boj-terms: 上記 + 「日本銀行によって保証されたものではありません」の免責文言を必ず併記
- jepx-terms / jma-terms / meti-terms / wb-pink-sheet-terms: 上記 + 「○○(機関名)公表値を EIC Data が加工」の旨を明示
9.5 派生指標(Insight 系)の著作権
複数指標を組み合わせた Insight ページ(例: 日米金利差 × USD/JPY、円建て LNG 算出)の 編集物としての著作権は EIC Data に帰属(CC BY 4.0)。ただし元データの著作権・ライセンスは各構成系列に従う。引用時は depends_on 配列で構成系列を明示し、それぞれのライセンスも併せて列挙する作法が望ましい。
実装: 各 fetch_*.py が書き出す {id}.metadata.json の license + license_url + license_notice + depends_on フィールドを、ビルド時に読み込んで指標詳細・Insight 詳細ページに展開。詳細は データ品質ダッシュボード から系列別に確認可能。
10. データ品質シグナルの読み方(Quality Signals)
EIC Data は各系列に 4 つのデータ品質シグナルを付与している。研究者・ジャーナリストが「この系列を今 引用しても大丈夫か」を 5 秒で判断できるよう、それぞれの読み解き方をここで整理する。
10.1 4 つのシグナル
| シグナル | 意味 | 読み解き方 |
|---|---|---|
| observation_cutoff | 最終確定値の日付 | この日以降の値は未取得。引用時の "as-of" として明示する |
| freshness_sla_days | 許容鮮度(日数) | cutoff から本日までの経過日数 ≤ SLA なら緑判定。超えたら警告(黄)または違反(赤) |
| missing_policy | 欠損データの扱い | null / forward_fill / interpolate の 3 系統。チャート上の欠損は埋められているか確認 |
| aggregation | 集約種別 | raw(生値)/ daily_mean / monthly_sum / derived など 10 種類。元データの粒度と加工度を読む |
10.2 SLA 違反の 3 パターン(重要)
データ品質ダッシュボードで赤表示される「SLA 違反」は、必ずしも「データ不正取得」を意味しない。3 つのパターンを区別する必要がある:
METI 電力調査統計(4 ヶ月遅れ確定)、World Bank Pink Sheet(XLSX が PDF より 4〜6 ヶ月遅れ)など、機関側の公開サイクルが SLA より長い場合。パイプラインに非はない。SLA 値の調整で誤検知を解消(例: fuel 60 → 180 日)。
JMA 最深積雪 9 地点のうち、関西 / 四国 / 九州は数年に 1 度しか雪が積もらない地点。「データの不在」ではなく「気象現象の不在」。 D-011 v2 で missing_policy: seasonal を導入予定。
観測所からの値到着が一時的に遅れる、パイプラインの fetch ロジックバグなど、速やかに調査・修正すべき違反。通常は次回 Nightly Fetch で自動回復。
10.3 警告(黄)と違反(赤)の使い分け
- 緑 (healthy): age ≤ SLA × 0.7、引用に最適
- 黄 (warning): SLA × 0.7 < age ≤ SLA、SLA に近づいている
- 赤 (violation): age > SLA、上記 3 パターンを区別して対応
詳細は データ品質ダッシュボード を参照。本セクションは Phase B-C の MDX 移植時に独立した /methodology/quality-signals ページに昇格予定。
11. 方法論ライブラリ — 回帰・記述統計・予測誤差の読み方
EIC Data の方法論 Insight は、過去データを使った分析手法を「隠さず全部見せる」教材として公開している。ここでは、その読み方を 回帰の読み方 / 記述的分析 / 予測誤差ベンチマーク の 3 つに整理する。いずれも 過去データ起点の方法論であって、未来予測値は提供しない という EIC Data の線引きを共有する。
11.1 回帰の読み方(in-sample fit ≠ 予測・因果)
EIC Data の方法論 Insight は、回帰モデルの出力を「隠さず全部見せる」ことを原則にする。読者が結果を鵜呑みにせず、自分で妥当性を判断できるようにするためだ。
回帰式を読むときに見るべきは 4 つ。回帰係数(各説明変数が目的変数に与える限界的な効き目=傾き)、標準誤差(その係数推定のばらつき)、t 値(係数がゼロと区別できる確からしさ)、そして 決定係数 R²(モデルが目的変数の分散をどれだけ説明できたか、0〜1)。
具体例として、Insight #70「JEPX 東京 月次回帰」では、東京エリアの月次価格を残余系統需要・円建て LNG・東京気温・前月価格で OLS 回帰し、係数・標準誤差・t 値・R² をすべて開示している。n=44(2022-05〜2025-12)で R²=0.883。ただし注意すべきは、前月価格 1 変数だけでも R²=0.834 に達する点だ。つまり高い R² の大部分は「価格の慣性(前月に似る)」で説明されており、他の変数の追加的な寄与は見かけより小さい。
ここで強調したいのは、この R² は「過去データへの当てはまり(in-sample fit)」であって、未来予測の精度でも、因果関係の証明でもないということ。当てはまりの良さと、将来当たるかどうかは別問題である(その検証は 11.3 を参照)。EIC Data は未来予測値を提供しない(過去データ起点の方法論教材に限定)。
11.2 記述的分析 — 「何が起きたか」を正確に測る
回帰の前段として、まず「過去に何が起きたか」を記述的(descriptive)に正確に測ることが重要だ。モデルを立てる前に、データそのものが持つ規則性を見る。
Insight #71「休日の電力パターン」は、その典型例である。JEPX 東京の価格が、通常営業日と比べて特異日にどれだけ下がるかを実データで測ると、ゴールデンウィークは約 −36%、お盆は約 −19%、年末年始は約 −1% という明確な差が出る。これは予測でもモデルでもなく、「過去に観測された事実の要約」だ。
記述的分析の価値は、後段のモデルが説明すべき「説明対象」を明確にすることにある。たとえば 残余需要モデルを組むなら、こうした休日効果をカレンダー変数として織り込むべきだ、という設計指針が記述統計から導かれる。
11.3 予測誤差のベンチマーク — 単純ベースラインに勝てるか
モデルが「使える」かどうかは、最も単純な予測(ベースライン)に勝てるか で測る。これは予測研究の世界標準で、EIC Data も同じ規律を採る。
代表的なベースラインが持続予測(ナイーブ予測)=「来月も今月と同じ」と置く方法だ。Insight #72「予測誤差ベンチマーク」では、月次 JEPX 東京を 4 つの単純ベースライン(持続予測 lag1 / 季節平均 / 12 ヶ月前同値 / 訓練期間平均)で out-of-sample(訓練 2012-2021 → テスト 2022-01〜2026-04、n=52)に検証し、MAE・RMSE・MAPE を全開示している。
結果は示唆的だ。持続予測が MAPE 11.94% で最良、季節平均 23.54%、12 ヶ月前同値 49.77% と、持続予測が他の約 2〜4 倍の精度で圧勝した。誤差分布は ±2 円以内が 65.4%、±5 円以内が 88.5%。つまり「来月も今月と同じ」という最も素朴な予測が、月次の電力価格では驚くほど強い。複雑なモデルを評価するときは、まずこの持続予測を超えられるかを問うべきだ。
誤差率の指標は使い分ける。MAE(平均絶対誤差)は外れ値に頑健、RMSE(二乗平均平方根誤差)は大きな外れを重く罰し、MAPE(平均絶対パーセント誤差)は水準の異なる系列を比較しやすい。いずれも out-of-sample(モデルが見ていない期間)で測ることが鉄則で、in-sample の当てはまり(11.1 の R²)と混同してはならない。
最後に限界も明示する。#72 のベンチマークは 2022 年の燃料価格急騰という構造変化を含む期間でテストしており、どのベースラインもこの局面では誤差が拡大した。過去データの out-of-sample 検証であって、未来予測ではない。モデルの優劣は「過去のある期間でどれだけ当たっていたか」を示すに過ぎず、将来の的中を保証しない。
本セクションの数値は実 Insight #70 / 月次回帰、#71 / 休日パターン、#72 / 予測誤差ベンチマーク 由来の照合済み実値。すべて過去データの分析であり、未来予測ではない。