next up previous contents
Next: 実験2 : 入力データの変換による予測精度の分析 Up: 実験1 : データの推移のパターンからの予測 Previous: 実験概要   目次


実験結果


表 5.2: 5日前のパターンから予測したときの予測誤差
地点
降水の有無の
適中率[%]

最高気温の
予測誤差(RMS)[C]

最低気温の
予測誤差(RMS)[C]
東京都 東京 67.59 4.07 3.26
北海道 稚内 63.63 4.30 4.08
秋田県 秋田 60.16 3.92 3.60
新潟県 新潟 59.95 4.06 3.53
滋賀県 彦根 56.14 4.32 3.98
和歌山県 潮岬 56.71 5.18 5.46
香川県 高松 63.95 5.09 4.85
島根県 松江 55.32 5.47 5.28
沖縄県 那覇 62.37 5.26 5.79


表 5.3: 10日前のパターンから予測したときの予測誤差
地点
降水の有無の
適中率[%]

最高気温の
予測誤差(RMS)[C]

最低気温の
予測誤差(RMS)[C]
東京都 東京 67.75 3.95 3.08
北海道 稚内 62.96 4.07 3.78
秋田県 秋田 59.77 3.72 3.38
新潟県 新潟 59.33 3.84 3.25
滋賀県 彦根 57.27 4.09 3.71
和歌山県 潮岬 57.71 5.20 5.41
香川県 高松 64.82 5.37 5.27
島根県 松江 55.49 5.81 5.65
沖縄県 那覇 62.09 5.51 6.03


表 5.4: 各地点の降水の有無の適中率と気温の予測誤差
地点
降水の有無の
適中率[%]

最高気温の
予測誤差(RMS)[C]

最低気温の
予測誤差(RMS)[C]
東京都 東京 75.92 3.27 2.73
北海道 稚内 69.76 3.25 2.96
秋田県 秋田 65.54 3.38 2.80
新潟県 新潟 65.98 3.27 2.57
滋賀県 彦根 66.62 3.51 3.11
和歌山県 潮岬 69.93 3.53 3.59
香川県 高松 74.86 3.86 3.64
島根県 松江 66.55 4.22 3.86
沖縄県 那覇 69.91 3.56 3.81

図 5.1: 降水量の自己組織化マップ
\includegraphics[scale=0.07]{fig/fig5-3.eps}

図 5.2: マップ上でのx座標の推移
図 5.3: マップ上でのy座標の推移
\includegraphics[scale=1.1]{fig/fig5-1.eps}
\includegraphics[scale=1.1]{fig/fig5-2.eps}


表 5.5: 予測の適中率
  地点
降水の有無の
適中率[%]

最高気温の
予測誤差(RMS)[C]

最低気温の
予測誤差(RMS)[C]
予測が  東京都 東京 75.92 3.27 2.73
良い地点  北海道 稚内 69.76 3.25 2.96
  新潟県 新潟 65.98 3.27 2.57
予測が  秋田県 秋田 65.54 3.38 2.80
悪い地点  島根県 松江 66.55 4.22 3.86


表 5.6: 前年の各地点の降水の有無の適中率と気温の予測誤差
地点
降水の有無の
適中率[%]

最高気温の
予測誤差(RMS)[C]

最低気温の
予測誤差(RMS)[C]
東京都 東京 65.90 3.28 2.35
北海道 稚内 58.10 2.95 2.71
秋田県 秋田 51.30 3.12 2.31
新潟県 新潟 48.90 3.52 2.31
滋賀県 彦根 58.50 2.93 2.15
和歌山県 潮岬 60.50 3.13 2.92
香川県 高松 70.10 3.55 2.58
島根県 松江 51.30 3.34 2.48
沖縄県 那覇 63.25 3.12 2.41


表 5.7: 気象庁の東京地区の公称値
  降水の有無の適中率 最高気温の予測誤差(RMS)
気象庁の公称値(1990年) 82.0% 2.00C
気象庁の公称値(1995年) 83.0% 1.95C
気象庁の公称値(2000年) 83.5% 1.95C
気象庁の公称値(2005年) 86.0% 1.90C
気象庁の公称値(2009年) 86.5% 1.70C

5.1に示した各地点において、 5日前からのデータの推移のパターンから翌日の天気を予測した結果を 表5.2示す。また10日前からのパターンから予測した結果を 表5.3に示す。

実際に自己組織化マップではどのように天気のパターンが分類されているかを 示すために、降水の有無のデータをマッピングした結果を 図5.1に示す。 また、マップ上で座標がどのように推移しているかを示すために x座標の約2年分の推移を図5.2に、 y座標の約半年分の推移を図5.3に示す。

これらのデータを比較するために, 天気のパターンを分類したマップの結果から翌日の天気を予測した結果を 表5.4に、また、 正規化が有効か判断するために、データを正規化せずにそのまま使って パターン分類した結果を、表5.6に示し[12]、 気象庁が公表している予測精度の公称値(過去5年間の平均値)を表5.7に示す。

この結果より、データの推移のパターンから天気を予測する方法は、 パターン分類したマップの結果から予測するより精度は低いと言える。 また、5日前からと10日前からの参照したパターン数を比べると、 全体的にごくわずかに10日前からの方が精度は高いが、 ほとんど違いはないと言える。

今回の結果を見るとデータの推移のパターンからの予測は、 降水の有無の適中では、高いところでは東京都東京の67.75%、 低いところでは島根県松江の55.49%となった。 全体的にみると、50%後半から60%前半にかけて 散らばっているような形になった。 気温は、良いところでも3Cほどで、 悪いところでは6.03Cも違いが出た。 また、パターン分類したマップの結果からの予測は、 降水の有無の適中は、高い所で東京都東京の75.92%、 低いところでは秋田県秋田の65.54%となった。 気温は、良いところで2.5C前後、 悪いところで3.86Cとなった。

降水の有無の適中率の低い所をみると、やはり去年と同じように 降水量の多い地点となった。 また、気温は誤差の大きいところだと4C前後も違うので、 表5.7と比べても予測には使えないほどにはずれてしまったが、 それを考察するために実際の自己組織化マップ上での 1日ごとの座標の推移をみる。 図5.1は、降水量がどのように分類されたかの図で、 白い部分が雨の予測、黒い部分が晴れの予測となっている。 図からわかるように上に雨の予測、下に晴れの予測が固まっている。 次に図5.2はこのマップ上でx座標がどのように推移しているかのグラフだが、 365日をかけて大まかに0から100へ上り、また0へ降りてきている。 このことよりマップ上での横の動きは1年をかけて 左から右、また左と規則に従った動きをしていることがわかる。 さらにこのことより、マップを縦に分割して見ると、 マップの左側は冬、右側は夏、そして真ん中が春と秋の気候を示していることがわかる。 最後に図5.3は常に0と100を行き来しているが、 これは先程述べたようにマップを縦でみた場合、 上が雨、下が晴れを示しているので雨が降ったり晴れたりするのでこのような形になる。 季節ごとに適中率の良い月と悪い月とがあり、 夏や冬は比較的適中率が良く、秋や春の適中率が低いことは報告されている[12]。 さらに今回の考察より、秋と春はマップ上でも同じ場所を参照して予測しているので、 細かい違いが判別できなかったと考えられる。

しかし、秋と春は実際の気候も似ているところはあるので このことが直接的な原因であるかはわからないが、 季節ごとに別のマップを用意し学習させることで 改善、もしくは別の理由がわかると思う。

データの推移のパターンから天気を予測する方法が パターン分類したマップの結果から予測するより精度が低くなったのも、 このような座標の推移の仕方をしたからだと思われる。 降水を表した、今回のマップだと縦方向の予測は、 雨が降った後は晴れる、一定期間晴れが続くと雨が降る、などの 正しい予測をしていると思うが、 横軸の季節ごとの気象に関しては自己組織化マップの予測では、 滅多に見られない気象より普段から見られる気象を重要視したいので、 入力データ自体の推移をグラフ化したときに、突出した値を丸めるなど平滑化したほうが 予測の精度が上がると考えられる。 また、今は降水量を表す軸と季節を表す軸を同じ比重で比較しているが、 降水量はマップの上で、降水の有無で0から100の座標で表されているのに対して 気温は1年を通して0から100で表されている。 これを1日の変化で見ると、降水量は1日で最大100の距離が開くのに対して、 気温は季節が1日で変わることはないので大きくても20程度の距離しか開かない。 このことを考慮して気温の比重をもっと大きくしたり、 季節ごとでマップを作り直すなどをすると予測精度はもっとあがると考えられる。

このことよりパターンからの予測では、 季節を表す軸に対しての平滑化や、 雨を表す軸に対して季節を表す軸の比重を増やすことによって さらに良い結果が得られると考えられる。

5.6の正規化していない結果とその他の正規化した結果を比べると、 気温の予測誤差は大きくなったところもあるが、 降水の適中率は確実に良くなった。 この結果より、入力データの正規化は有効であると仮定して、 入力データの正規化を行った上で 他の方法で気温の予測誤差を小さくすることを考えるのが 良いと思う。


next up previous contents
Next: 実験2 : 入力データの変換による予測精度の分析 Up: 実験1 : データの推移のパターンからの予測 Previous: 実験概要   目次
Deguchi Lab. 2013年2月28日