衛星画像データ解析システムの開発



東京情報大学 布広 永示

 衛星画像データは,環境分野,農業分野から経済分野など,幅広い分野の研究で利用されている。これらの研究を推進するためには,衛星画像データの管理とデータを活用するための環境の構築が必要である。本論では,戦略的研究基盤形成支援事業の一環として進められている気象変化や環境変動などに関する研究を支援する衛星画像データ解析システム(以下,解析システム)の利便性や高性能化を実現する上で必要なデータベース化,計算資源の仮想化やスケジューリング機能などについて記述する。この解析システムは,衛星画像データ(以下,MODISデータ)の管理・公開やMODISデータを利用したアプリケーションプログラム(AP)の実行環境の構築を目的としている。

【衛星画像データ(MODISデータ) 】

 解析システムでは,受信したMODISデータの中からMODIS標準プロダクトであるMOD02(大気上段反射率データ),MOD03(衛星姿勢データ),MOD09(地表面反射率データ),MOD11(地表面温度),MOD14(異常温度),MOD28(海面温度)を管理する。MODISデータのバンド情報を表1に示す。MOD02は,異常温度探知のため,36バンドの中から熱赤外域であるバンド21,22とバンド32を用いる。MOD03は,衛星の姿勢情報から,各画素の緯度経度情報とセンサーの角度や太陽の位置などが記録されている。この情報はMODISデータの地図化やコンポジット処理時に有効なデータである。MOD09はMOD02データから大気のエアロゾルの散乱や吸収の補正を行った高次処理データである。MOD09は7つのバンドで構成され,3つの可視域バンド(バンド1,4,3)を用いた衛星データの可視化,近赤外バンド(バンド2)を用いた植生指数(光合成活動に相関が高い),3つの短波長赤外バンド(バンド5,6,7)で雪と雲の識別や異常高温地域検出に有効なデータである。主に陸域変化抽出や土地利用解析に多く用いられる。

【解析システムの構成】

 解析システムの構成を図1に示す。本システムは,Webサーバ,PCクラスタとBladeCenterで構成される計算ノード,データベースで構築される。



 ユーザは,Webサーバにアクセスし,APの実行やMODISデータを利用する。Webサーバは,ユーザからの処理を受け付けて,計算ノードで実行し,その結果を表示する。計算ノードは,APの特性に応じてPCクラスタやBladeCenter上でAPを実行する。データベースは,APが利用し易いようにピース化処理やコンポジット処理されたMODISデータを管理する。

●ピース化処理



 異なる衛星軌道から観測したデータを時系列的に解析するためには、各データを決まった地図投影法で表示させる必要がある。地図投影はセンサー観測データ(MOD02又はMOD09)とデータの地図座標情報(MOD03)を用いて再サンプリングする。このため,あるピクセルが撮影範囲外の経緯度の場合には,撮影で記録する事がほとんどないパラメータの値(MOD02の時65000,MOD09の時 -10000,図2における黒い範囲)を入れてデータを作成する。ピース化処理は,このような不要な部分を削除してデータを管理するために,MODISデータを経緯度を元に格子状に区切る処理である。また,ピース化処理によって,APは小さな単位でMODISデータを利用することが可能となる。ピース化処理のイメージを図2に示す。現在,ピース化処理の範囲は緯度10~67度,経度100~167度で2度単位に分割して作成中である。



●コンポジット処理



 MODISデータのように広範囲を観測する衛星データを用いて地表面解析を行う場合,雲などの影響が問題となる。そこで,同じ場所で一定期間のデータの中から雲などの影響が少ない日時のデータを選択し,それを一定期間の代表値としてデータを合成するコンポジット処理を行う。コンポジット処理のイメージを図3に示す。コンポジットの期間は,研究目的や地域によって異なる。例えば,植生の季節別変化特徴を用いた自然変化などを解析する場合は,短いコンポジット期間が必要になる。



【解析システムの効率化機構】

 MODISデータを使用する解析処理は,データを大量に利用する。そこで,システム資源の有効利用や実行性能を向上させるため,LSM(Logical Storage Manager)と呼ぶ管理プログラムがPCの構成やローカルディスク内に格納されているデータを管理する。LSMは,ストレージ仮想化機能やスケジューリング機能を実装しており,APの実行に必要なPCやストレージを仮想的に構成する。

●ストレージ仮想化



 APの実行イメージを図4に示す。APが実行するPCはLSMによって動的に決定される(①)。一方,MODISデータは,LANで接続されたグローバルディスクに格納されており,実行するAPが実行するPCが決定した後に,ローカルディスクにデータを転送してAPとデータを動的に結合する(②)。このように,データを仮想化することによってAPが実行するPCやAPが利用するデータの動的資源調整が可能となり,システム資源の利便性を向上できる。

●スケジューリング機能



 スケジューリングの例を図5に示す。LSMは,過去の実行状況からローカルディスク上に配置されているデータとAPが利用するデータを調べて,APが実行するPCの構成を動的に決定する(①)。このスケジューリングにより,PC内のローカルディスクとグローバルディスク間のデータ転送を削減する(②)。