作ったランダムフォレスト予測モデルで実データを元に予測してみた

日次の気象情報から電気消費量を予測するモデル

GitHub - og3/denkiyohou: 日次の気象情報から電気消費量を予測するモデル
日次の気象情報から電気消費量を予測するモデル. Contribute to og3/denkiyohou development by creating an account on GitHub.

現状の予測精度

 2023年2月から2025年2月までの気象と電気使用量のデータで学習したランダムフォレスト予測モデルの精度は以下の通り。

$ python predict_power_consumption.py
# 予測と実際の差(誤差)の大きさを平均的にどれくらいかを表す指標:1日当たり平均して2.73kWhくらい使うってこと
RMSE: 2.7310133760199715
# モデルがどの程度「傾向」をつかめているかを表す指標で、0〜1の間の値になる。:4割くらいはデータの傾向がつかめているってこと
R²: 0.4127938362704643

学習データ:

denkiyohou/datas/daily_weather_and_power_consumption.csv at main · og3/denkiyohou
日次の気象情報から電気消費量を予測するモデル. Contribute to og3/denkiyohou development by creating an account on GitHub.

2025年3月の気象と電気使用量のデータを元に予測してみた

 上記のモデルで気象データから電気使用量を予測してみた。

date 予測(kWh) 実際(kWh) 乖離(kWh)
2025/3/1 6.125 4.5 1.625
2025/3/2 6.49 3.9 2.59
2025/3/3 11.112 4.7 6.412
2025/3/4 14.342 5.1 9.242
2025/3/5 11.726 4.7 7.026
2025/3/6 9.303 6.3 3.003
2025/3/7 9.886 4.6 5.286
2025/3/8 12.264 4.2 8.064
2025/3/9 10.732 7 3.732
2025/3/10 10.187 4.4 5.787
2025/3/11 7.803 4.2 3.603
2025/3/12 5.937 5.2 0.737
2025/3/13 5.677 5.6 0.077
2025/3/14 7.104 6.1 1.004
2025/3/15 9.586 4.4 5.186
2025/3/16 8.35 5.4 2.95
2025/3/17 7.694 6.6 1.094
2025/3/18 10.145 5.2 4.945
2025/3/19 11.965 5.7 6.265
2025/3/20 10.309 7.7 2.609
2025/3/21 7.485 8 -0.515
2025/3/22 5.909 7.5 -1.591
2025/3/23 6.322 5 1.322
2025/3/24 6.415 4 2.415

 乖離がだいぶあることが分かった。

 次はモデルの精度を上げるために、乖離が大きい部分と小さい部分のデータを見ていく。

気象データ:

気象庁|過去の気象データ検索
気象庁|過去の気象データ検索

予測モデルの精度を高めるためのアプローチまとめ

 以下の手順でやっていく。

  1. 乖離が大きい日と少ない日のデータを観察して、予測に寄与している特徴量を特定する
  2. 特徴量の追加と削除
  3. ランダムフォレストのパラメータ調整(木の深さ、数など)

スクリプトの課題まとめ

 現状の作業では以下の課題があるので、今後解決させていく。

  1. データの取得と整形が面倒くさい=>自動取得と前処理の自動化をやる
  2. 前処理、モデルの生成・更新、予測の工程をそれぞれのスクリプトに分ける

コメント