情報基盤研究グループ(IIRG)研究状況



東京情報大学 布広 永示, マッキン ケネスジェームズ,朴 鍾杰,松下 孝太郎,山口 崇志,花田 真樹 浅沼 市男,原 慶太郎
日本大学 五十嵐 正夫,柳澤 幸雄

1.はじめに



情報基盤研究グループは,広域衛星データ(NOAA, MODISデータ)を活用して数理的解析を行い,その結果を情報発信する研究を進めている。研究開発内容としては,研究基盤システムである衛星画像データ解析システムの開発,解析システムの性能を向上させるための高性能コンピューティング技術の研究,MODISデータを利用した災害マップの開発,土地被覆変化の抽出などの数理的解析手法の研究などがある。本報告では,衛星画像データ解析システムSIDAS(Satellite Image Data Analysis System)の開発とMODISデータを活用した研究例として気温変化に関する研究について報告する。

2.衛星画像データ解析システムSIDASの開発            (布広永示)


2.1 SIDAS の概要
衛星画像データ解析システムSIDASは,衛星データMODISを利用した研究の概要や視覚化した衛星画像データの公開,過去の衛星画像データの検索機能の提供などを目的としている。SIDAS開発の体制と解析システム関連の研究テーマを図1に示す。
現在,SIDASでは、東日本大震災の復興支援を目的として、東北地方のNDVI、LST、SST、RGBに関する視覚化情報を公開している。また、検索するデータの種類、コンポジット期間範囲、日付を指定し、特定の衛星画像データを検索することができる。SIDASのホームページ画面を図2に示す。

 図2 SIDASのホームページ ( http://sidas.tuis.ac.jp)
2.2 SIDAS のシステム構成
SIDAS は,Webサーバ,APサーバ (計算ノード),データベースで構築される。ユーザは,WebブラウザからWebサーバにアクセスし,表示される画面に従って解析処理の実行などを依頼し,その結果を確認する。Webサーバは,ユーザからの実行依頼を受け付けてAPサーバに対して処理の起動とその処理で利用するMODISデータを通知する。APサーバは,依頼された処理で利用するMODISデータをMODISデータベースからAPサーバ内のディスクに転送して当該処理を実効し,その結果をWebサーバに返送する。SIDAS の処理の流れを図3に示す。
2.3 数理的解析処理の拡張
解析システムの目的の一つとして,MODISデータを利用して,環境の変化や地表面の変化などに関する研究を支援することがある.これらの研究の解析手法としては,自己回帰分析などの統計解析やニューラルネットワークなどの知識情報処理などを適用し,土地被覆変化の抽出,NDVIの時系列予測などがある。現在,これらの研究は個別に実施しているが,SIDASから利用できるように機能拡張する予定である。
①東アジアの土地被覆変化抽出の傾向分析
2001年から現在まで東アジアの土地被覆変化を抽出し,その原因を調べる。
②東アジアの災害図(火災,洪水)の作成
洪水や火災など自然災害の抽出の自動抽出について研究する。
③自己回帰分析を用いたNDVIの時系列予測
統計的手法を用いて広域観測が可能な衛星データを用いて水表面温度と地表面温度から植生データ(NDVI)の変化を調べる。
④知能情報処理を用いた土地被覆領域分類
ニューラルネットワーク,自己組織化マップなどの 知能情報処理手法を用いた土地被覆分類の研究を行い,土地被覆分類の精度向上を目指す。

図3 SIDAS の処理の流れ
2.4 SIDAS の拡張機能
SIDASは2008年から開発をスタートし,現在SIDAS Ver3.0の検討を進めている。今後は,システムの操作性や性能,解析機能の公開などに関して次のような拡張を進めて行く予定である。
(1)ユーザインタフェースの拡張
・WEBGIS(地図情報システム)の実装
メタ情報提供(ポイント・エリア)
・Webアプリサービスの提供
データ操作ミドルウェア実装
地図情報システム拡張
(2)システム性能改善機能の拡張
・システム仮想化機能の改善
・データコンポジット機能の改善
・システムリモート監視機能の拡張

3. 気温に魅せられて (五十嵐 正夫)


3.1 はじめに
本プロジェクトにおける担当分野は,広域衛星データが観測し公開している植生データ(NDVI),陸表面データ(LST),海表面データ(SST),日本の気象台が公開している月単位の気象データ等から,アジア東岸域の大域的なそれらの動向を把握し,整理し,公開することであった。著者の研究領域との関係から,それらの解析手法には非線形フィッティング法を用いることにし,次の5つの方針を立てた。
1) データを可視化しその傾向を見定める。
2) データに良く適合する非線形曲線モデルを決める。
3) データと得られた曲線の適合度合いの判定基準を決定する。
4) 非線形曲線の係数を反復法で決定する。
5) 得られた結果の整合性の検証を行う。
3.2 具体的な解析手順
1) ほとんどのデータは1年程度の基本周期を持っていた。これはデータの性質からして,十分納得のいく傾向である。もちろん10年,100年,1000年と言った大きな周期もあると推定はされるが,データ長の関係から見いだすことはできなかった。
2) この分野の連続的時系列データは一般に次のように定式化されている。   データ=過渡的成分+周期成分+確率過程成分 +カタストロフィー成分 データから過渡的成分(トレンド),周期成分,カタストロフィー成分を取り除いてから解析を行うのが時系列解析の標準手法のようであるが,ここでは過渡的成分と周期成分をみるために確率過程成分とカタストロフィー成分は無視し,モデルを決定した。過渡的成分は時間変数tの1次または2次多項式,周期成分はsin(tの1次式)とした。
3) 得られた曲線とデータとの適合度合いの判定には両者の相対誤差の算術平均を利用した。
4) 最小2乗法とニュートン法を用いてモデルの係数を決定した。係数決定のための多変数超越方程式系の解法には数式処理ソフトを用いた。
5) NDVIに関しては得られた曲線の極値をとる月から作付け作物の変化の様子が推定できた。SSTに関しては台風発生地域の温度曲線に極めて特徴があることが分かった。LSTに関しては草地と砂漠の判別がついた。
3.3課題
解析にあたっての課題は二つあった。一つは,雲や機器設定等の影響で観測データに欠測値があった場合は周辺の観測値を用いて補間したが,その補間の理論的裏付けは困難であった。一つは,データは人力で処理する部分があり,人力ミスのチェックゲートを何重にもする必要があり,その作業が繁雑であった。
3.4 まとめ
日本の気象庁が公開している1880年代からの気象データ,また例えばオーストラリア,ドイツ,イギリス等の気象庁が公表しているデータに,ここで提案した方法を適用してみた。データ内容は月ごとの最高気温,最低気温,平均気温であった。地方気象台毎に100年間程度のデータが公開されているので,一つのデータ長は1000程度である。それらおよそ3000個以上のデータに対して実験を行ってみたが,全ての場合について提案する反復停止則はうまく働き,具体的な非線形関数が得られた。さらにデータと非線形曲線の相対誤差を検証したが,全ての場合1.5桁程度の精度があった。この意味においてここで提案した方法は実用性と頑健性を持っていると言える。  さらに,ここで提案した方法を,月ごとの日本の最高気温や最低気温に当てはめ,日本の気温の動向の調査も行った。網走1900-2010年,根室1880-2010年から始まり,石垣島1900-2010年と言ったように100年以上にわたる日本の平均気温を決める17箇所の観測点のデータを利用した。得られた非線形曲線と観測点の直近の5年間の月ごとの平均との差異を算出し緯度順にプロットしたのが図4(最高気温の動向)と図5(最低気温の動向)である。去年の夏は暑く,今年の冬は寒いから「夏暑ければ冬寒し」と考えられるが,6月が例年に比べて寒いと8月は暑く,11月の気温が低いと2月の気温が高いことが読み取れる。この傾向は山形,伏木,水戸,浜田等で顕著である。日本の52箇所の地方気象台でもこの傾向は同じであった。冷暖房などの利用が影響を与えていることも考えられるが,注意すべき傾向と思われる。 最後に本プロジェクトに参加できたことを大変誇りに思い,有り難いことであったと深謝しております。

図4 最高気温の動向

図5最低気温の動向