データ番号 | データ数 | 降水の有無の
適中率 |
最高気温の
予測誤差(RMS) |
最低気温の
予測誤差(RMS) |
データ1 | 18 | 67.10% | 3.25℃ | 1.77℃ |
データ2 | 16 | 67.10% | 3.09℃ | 1.76℃ |
データ3 | 14 | 67.10% | 3.09℃ | 1.76℃ |
データ4 | 9 | 67.10% | 3.09℃ | 1.76℃ |
データ5 | 6 | 67.10% | 3.09℃ | 1.76℃ |
結果をみると、データ数を少なくしても適中率や予測誤差は変化しないということが分かった。また、データ1とデータ2を比べると、データの少ないほうが東京管区気象台に関しては気温の予測誤差が改善されてるということが分かる。
データを減らしても結果が変化しない原因は、観測した気象データの全てに相関性があるという事が考えられる。そもそも気象変動の原因となっているものは大気の循環であり、[2]大気の状態を表現するために気圧や気温、風速などのパラメータが存在するため、「気圧が低いと雨が降る」、「日射時間が長いということは晴れなので気温が高い」という相関性が互いに存在する。自己組織化マップは学習の際にベクトル量子化を行っているので、相関性のある入力データによって天気のパターンが変わってしまうことは少ないと言える。ただし、これは本研究が1ヶ所のみで小規模な気象予測を行うことを目的として天気のパターンから気象予測を行っているためであり、大気に関する運動方程式などを用いて予測する現在の気象予測ではそれぞれのパラメータに独自性を持つようになり、湿度や風向風速などのパラメータが必要になると考えることができる。
次に、気圧の観測データがある場合とない場合を比較して、気圧の観測データがない場合の方が予測精度が良くなったという結果について考察する。気圧による気候の変化は「気圧そのものの値」について決定されるのではなく、「気圧配置」によって決定される。そのため、たとえ気圧が1013hPaだとしても、観測値の周辺の気圧が低ければ高気圧となり晴天となるが、周辺の気圧が高ければ低気圧となり雨天となる。先述したように本研究は1ヶ所のみで小規模な気象予測を行うことを目的としているため、気圧配置などの情報は観測データから読み取ることが出来ない。この気圧そのものの値の曖昧さが天気パターンの分類を妨げることとなり、結果的に気圧を入力したデータのほうが予測精度が悪くなったということが考えられる。
以上の結果から、入力したデータには冗長性があり必要の無い測定値があることが分かる。従って、本研究で行う予測手法では、降水量の測定を行う雨量計と気温の測定を行う温度計のみで気象予測が可能であるといえる。ただしこの冗長性は、言い換えると観測データを増やしたとしても予測結果があまり変わらないということを意味する。すなわち観測地が多雪地域である場合に雨量計と温度計に加えて積雪深計を用意して積雪量の予測を追加して行ったり、風の強い地域である場合に風速計を用意して風向風速の予測を行ったりしたとしても予測結果があまり変わらないため、フレキシブルな気象の予測を行うことができるといえる。