データ番号 | データ数 | 降水の有無の
適中率[%] |
最高気温の
予測誤差(RMS)[ ![]() |
最低気温の
予測誤差(RMS)[ ![]() |
データ1 | 18 | 66.60 | 3.61 | 2.96 |
データ2 | 16 | 64.70 | 3.48 | 2.69 |
データ3 | 14 | 60.45 | 2.96 | 2.12 |
データ6 | 12 | 65.20 | 2.80 | 1.84 |
降水量の入力データをを段階化して自己組織化マップに学習を行い、 気象予測を行ったときの予測精度を表5.12に示す。
表5.12を見ると、データ1の結果は実験2のときよりもよくなり、 実験2で行った結果であるデータ4、5と殆ど差がないほどまでになっている。 しかし、データ3ではデータ1、2、前回のデータ3と比べても悪くなっていることがわかる。 また新しく作ったデータ6ではデータ1、2と殆ど差がないという結果になった。
データ1の結果から風のデータを直すことで、うまく分類ができるようになったといえる。 しかし、実験を行った内では風のデータが一番影響を与えるデータ3では、 予測結果が悪くなった。 その原因としては、気温のデータを残すために正規化を行っていないために、 気象の分類がうまく行えていないことだと考えられる。 今回では、最大瞬間風速が大きすぎることがデータ3の予測精度が悪くなった原因と考えられる。 最大瞬間風速は、大きいときには30を超え、小さいときは5程度である。 この差は25程度と大きくはあるが許容範囲内であった。 しかし、直交座標系を用い、風向きの情報を表すときにマイナスを使ってしまったために、 最大と最低の差が60近くできてしまった。 また、特別大きいところではなく、 南北反対の風向きになるだけでも20程度の差ができてしまっていた。 そのため、データ数が減るに従って風の影響が大きくなり過ぎ、 他のデータが影響されにくくなっていたと考えられる。 その結果、データ3では予測が悪くなり、 最大瞬間風速を減らしたデータ4では他のデータと差がない結果になったと考えられる。
これらの結果から、データ数と予測精度には大きな関わりはないとわかる。 特に実験2と同様に相関性のあるものや、予測に必要のないデータは入れる必要がないといえる。 しかし、入力するデータ数によって個々のデータが学習に与える影響の大きさが変わるため、 予測精度が悪くなることがある。 これを解消するためには、 気温のデータを残したまま、 入力データを正規化する必要があると考えられる。