情報基盤研究グループ(IIRG)研究状況



東京情報大学 布広 永示, マッキン ケネスジェームズ,朴 鍾杰,松下 孝太郎,山口 崇志 浅沼 市男,原 慶太郎
日本大学 五十嵐 正夫,柳澤 幸雄

1.はじめに



情報基盤研究グループでは,広域衛星データ(NOAA, MODISデータ)に関する情報を発信するための衛星画像データ解析システム (SIDAS : Satellite Image Data Analysis System)の開発,SIDASのシステム性能を向上させるための高性能コンピューティング技術の研究,そしてMODISデータを利用した災害マップの作成,土地被覆変化の抽出などの解析手法の研究を進めている。本報告では,東日本大震災の状況を観測する目的で機能拡張したSIDAS 1.2の「自動データ配信機能」,「ソフトコンピューティングによる類似画像検索」の研究状況について報告する。

2.自動データ配信機能 (布広永示)


2.1 SIDAS のシステム構成
SIDAS は,Webサーバ,APサーバ (計算ノード),データベースで構築される。ユーザは,WebブラウザからWebサーバにアクセスし,表示される画面に従って解析処理の実行などを依頼し,その結果を確認する。Webサーバは,ユーザからの実行依頼を受け付けてAPサーバに対して処理の起動とその処理で利用する衛星画像データ(MODISデータ)を通知する。APサーバは,依頼された処理で利用するMODISデータをMODISデータベースからAPサーバ内のディスクに転送して当該処理を実効し,その結果をWebサーバに返送する。SIDAS の処理の流れを図1に示す。
2.2 SIDAS 1.2 の拡張機能
本研究では,MODISデータを活用して,東日本大震災の被災地域に関する植生などの再生状況のモニタリング,その解析結果の自動配信を行う自動データ配信機能を実装したSIDAS V1.2を開発した。本バージョンでの配信は東北地方の被災地域に関する次の情報である。
(a) 2010年3月~2011年3月までの画像情報
(b) 2011年3月11日以降の画像情報,NDVI,SST,LSTの可視化情報
(e)(a),(b)に関する1-dayコンポジット,15-dayコンポジット,1-monthコンポジット情報
SIDAS V1.2の処理の流れを図2,NDVIの可視化情報とRGB画像情報の時系列データに関するWebページの例を図3に示す。
2.3 自動データ配信機能
SIDAS 1.2では東日本の可視化情報を配信するために,次に記述するデータ配信処理を実行する。
・APサーバ
① MODISデータベースから東北地方を含んだ一日分の衛星データ(HDFファイル:MOD02,MOD03,MOD09,MOD11,MOD13,MOD28,MOD35)を取得する。
② ①で受け取ったデータから東北地方の領域を取り出す。
③ ②で作成したデータに対して1-dayコンポジットを行う。1-dayコンポジットとは,一日数回受信されたMODISデータから受信状態の良いデータを選択して一つに合成する処理である。また,1-dayコンポジット処理において,HDFファイルをBSQファイルに変換する。
④ ③で作成した観測当日のBSQファイル(MOD02)からRGB化された画像情報,そしてBSQファイル(MOD11、MOS13、MOD28)からNDVI,NDVI,SSTの可視化情報を作成してSIDASのデータベースに保存する。
・Webサーバ
データベースから④で作成した画像情報と可視化情報を取り出して公開する。
(WebページのURL http://sidas.tuis.ac.jp)

図1 SIDAS の処理の流れ

図2 SIDAS V1.2の処理の流れ

図3 SIDASのWebページ例

3. ソフトコンピューティングによる類似画像検索 (山口 崇志)


 前述の通り,SIDAS1.2では受信した衛星画像を逐次処理し可視化情報を配信する機能を実装した。将来的に,これら配信される可視化情報は,MODISデータを利用した研究の成果をフィードバックし拡充していく予定である。ここではSIDASシステム上のアプリケーションとして研究・開発が進められている,衛星画像上での類似画像検索システムを取り上げ、その研究成果を報告する。
3.1 衛星画像上での類似画像検索
衛星画像上での類似画像検索とは,与えられた島や地形の画像の領域を膨大な衛星画像上から発見するシステムである。本研究では,検索画像にある形状を識別してマッチングする為,類似画像検索を非類似度が最少になるようなアフィン写像のパラメータを求める最適化問題としてモデル化した。これは,与えられた検索画像を座標(x軸およびy軸),拡大率,回転角度の4つのパラメータにより衛星画像上への写像を得た後,その領域において非類似度の低い領域を返すシステムである。非類似度は明度の平均誤差を用いた。 この類似画像検索問題は4変数からなる目的関数の最適化問題である上,検索対象となる衛星画像が多く,画像のサイズも大きいことから,解空間が非常に大きくなる。このような広大な解空間の探索は,反復法等による全探索では膨大な処理時間を要する為,現実的ではない。したがって,本研究では遺伝的アルゴリズム(GA: Genetic Algorithm)や粒子群最適化(Particle Swarm Optimization)等,ソフトコンピューティングによる解法を検討した。
3.2 類似画像検索アルゴリズムの高速化
過去の研究において,類似画像検索の広大な解空間を実時間で探索する為に,並列処理が可能なGAの拡張である分散GAを用いPCクラスタ上にシステムを構築した。現在はさらに類似画像検索アルゴリズムを高速化する為,探索手法の改善と転移学習の適用を検討している。
3.3 開発環境
開発言語にはJavaを使用した。また,Javaの統合開発環境にはEclipse,3次元表示にはJava3Dを使用した。 なお,今後,用途の拡張やマンマシンインタフェースの改良において,C++やPOV-Rayを併用する可能性が考えられる。 GAは生物の遺伝の仕組みをモデルにした集団探索手法の一種で,解空間を縮小しながら複数の個体で並列に乱数探索を行う近似解探索手法である。GAは幅広い問題に対し適用可能な反面,十分に良い解を得るまでに解空間の大きさに比例した長い反復処理が必要になることが多い。その為,連続空間においてより高速に解の探索が可能であるPSOを適用した。 PSOはGAと同様な集団探索手法の一種であり,昆虫等の群れの動きをモデル化した群知能手法である。各個体はお互いに良い解の情報を通信しながら,問題空間内を移動し近似解を求める。図4に類似画像検索における提案するPSOとGAの比較を示す。横軸が実処理時間で縦軸が適合度(画像の類似度)である。グラフ内の提案手法は後述する転移学習を適用する為に拡張したPSOである。またこのPSOは並列処理への適応を行っていない為,並列処理を行わない一般的なGAとアルゴリズムの性能比較を行った。この結果では提案手法が非常に高速に良い解を得ているのが分かる。なお,この拡張PSOは分散GAと同様に個体のグループを形成し,グループ間通信を行うモデルである為,今後,グループ間通信の仕組みを検討することで並列化が可能であると考えられる。 現在はさらに転移学習の応用による高速化の検討を進めている。転移学習は与えられた問題を効率的に解く為に,別の類似した問題で得た知識を転用するメタ学習手法である。この類似画像検索では,新たな検索画像が入力される度に長時間の探索を行う必要があることに注目し,転移学習を適用することで過去の類似した検索画像の探索結果を利用して高速に検索するのが狙いである。転移学習を用いたPSOによる類似画像検索システムは基礎実験ですでに良い結果を得ており,最大で3分の2程度まで処理時間が削減されている。しかしながら,実際の運用に向けて,検索画像の類似性の定義や過去の学習結果の記憶する条件等について議論が必要である。

図4 提案する拡張型PSOとGAの処理速度比較