情報基盤研究グループ(IIRG)研究状況



東京情報大学 布広 永示, マッキン ケネスジェームズ,朴 鍾杰,松下 孝太郎,山口 崇志 浅沼 市男,原 慶太郎
日本大学 五十嵐 正夫,柳澤 幸雄

1.はじめに



情報基盤研究グループでは,広域衛星データ(NOAA, MODISデータ)を利用するための情報基盤である衛星画像解析システムの開発・MODISデータ配信や土地被覆変化の抽出,NDVI の時系列変化など,MODIS /NOAA衛星データの数理情報解析に関する研究を進めている。本報告では,「植生指数を用いた多変数非線形モデルの研究」,「正規化植生指数の可視化に関する研究」の研究状況について報告する。

2.植生指数を用いた多変数非線形モデルの研究 (五十嵐正夫)


2.1 はじめに

このプロジェクトにおいてNDVI,SST,LSTデータのモデル関数や変化の推移を担当している。それらのデータ散布図からは,周期性を有する非線形の曲線模様が浮かんでくる。生物成長曲線のような特定の非線形モデルの場合は,線形化してモデルの係数(母数)を計算することはできるが,ここで扱うようなデータに対しては,そのような手法の適用例は見あたらなかった。そこでデータ散布図から非線形モデルを推定し,そのモデルに対して最小2乗法とニュートン法を適用することを考えた。


2.2 使用言語
非線形モデルの係数を求めるには多変数ニュートン法を実行する必要がある。求める非線形モデルの係数が6個あれば,6変数のニュートン法を用いる必要がある。従来であればFortranなどの計算処理言語を用いてプログラムを書くわけであるが,今回はMathematicaという数式処理言語を利用した。この言語の中にはFindFitという組込関数があり,偏微分や反復停止則などの細かなプログラムを書く必要がない。この言語の特徴は,数式処理言語としての高機能性は別として,FortranのExcel版に近いと感じた。
2.3 アイデア
Mathematicaは大方の問題に対して,要望に応じてデータの散布図にふさわしい非線形モデルの係数を出力する。しかし非線形モデルの中に超越関数(今回の場合は正弦関数)があると,FindFitはその機能を発揮できないようである。そこでデータの持つ周期を,あらかじめ範囲推定しておいてFindFitを適用することにした。本データから周期n(整数)は,散布図から10≦n≦30の範囲であると推定できるので,nを固定してFindFitを適用した。出力結果はこの場合21個となるが,この中から最適なnを1つ決める尺度が必要となる。そこで相対誤差和の平均値と見なせる評価基準を導入し,それをCRと名付けた。CRは相対誤差和の平均であるから値域としては0≦CR≦1であり,ゼロに近ければ近いほどモデルはデータを良く説明していることになる。例えばCR=0.001だと-log10CR=3より,データとそれに対応するモデル関数値は10進数で3桁程度の一致が見られる,と推定できる。
2.4 評価の検証
導入したCR評価が果たして合理的であるかの検証がある。一つの方法としては21個の出力とデータ散布図の視覚による比較がある。この視覚による比較は大事であるが,図の縦軸・横軸のスケール表示の違いにより,どれが最適であるかの判断に迷う場合がある。そこで線型モデルの評価基準と数値比較をすることにした。線形モデルの場合は,重相関係数R2 と呼ばれる評価が知られている。値域は0≦R2≦1の範囲であるが,1に近いほどモデルをよく説明している。この指標は非線形のモデルに対しては適用できないとされているが,他に簡易な指標がないために,非線形モデルやときには時系列モデルに対しても便宜的に利用されているようである。そこでCRで一番良いnとR2で一番良いnの一致度を調べた。
2.5 数値結果
非線形モデルは2つ,一つは2次関数+正弦関数,もう一つは1次関数+正弦関数である。データとして20年間のNDVIを主に用いた。CRに対する最適なnとR2に対する最適なnが異なるのは数パーセントであった。このことはCRの評価の妥当性とR2評価の頑健性を意味していると考えられる。Terra/MODISで得た2000年から2009年の最大値NDVIに対するCRとR2の振る舞いを図1に示す。最良のnは一致している。

図1:CRとR2の振る舞い 横軸はn,縦軸はCR(青色)とR2(赤色)
2.6 まとめ
NDVIのデータを中心に,非線形フィッテング問題を考察した。印象の一つにNDVIデータの獲得法があった。ある一定期間の観測値の最大値をデータとして取り入れざるを得ず,また雲などがデータに対して強い影響を与えていることを知り,このようなデータに対する頑健性を持った手法の開発の必要性を強く感じた。今の時点におけるおもな成果は,非線形フィッテング問題の当てはまりに関してR2評価に変わるCR評価の発見である。今後は,単年度フィッテング問題からから多年度フィッテング問題を中心に考察をすすめ,NDVI,SST,LSTデータの変化の推移とその方向性をグローバルに把握したいと考えている。

3.正規化植生指数の可視化に関する研究 (松下孝太郎)


3.1 はじめに
本研究では,正規化植生指数(NDVI)を可視化するシステムの開発を行っている。正規化植生指数を可視化することにより,植生分布を視覚的に理解することが可能となる。また,本研究は,一般に広く公開し,様々な用途での使用に寄与することを目的としている。
3.2 開発方針
本システムは,一般に公開することを目的としていることから,専用の計算機を用意することなく,一般家庭で使用されている計算機においても動作可能する仕様とした。さらに,使用に際しても,計算機の専門家でない者でも容易に使用できるよう開発した。
3.3 開発環境
開発言語にはJavaを使用した。また,Javaの統合開発環境にはEclipse,3次元表示にはJava3Dを使用した。 なお,今後,用途の拡張やマンマシンインタフェースの改良において,C++やPOV-Rayを併用する可能性が考えられる。
3.4 開発手順
本システムの開発手順を図2に示す。また,各手順の概要を下記に示す。

図2 開発手順
(1)NDVIデータの取得
NDVIは(赤外波長-赤波長)/(赤外波長+赤波長)によって算出されるが,筆者らが使用している衛星画像受信システムでは,NDVIデータを直接画像形式で得ることができる。
(2)対象領域の抽出
得られたNDVI画像から,可視化する対象領域を抽出する。今回は,北海道を対象領域とした(図3)。

図3 北海道のNDVI画像
(3)代表値の算出
NDVI画像をそのままの状態(分解能)で使用することもできるが,様々な用途での利用が考えられるため,任意の面積ごとに代表値で表示できるようにする。具体的には,一定の正方形領域ごとに平均値を算出し,それを代表値とする。なお,今回はシステムが開発段階にあるため,NDVI画像をそのまま使用した(図4)。

図4 代表値算出画像
(4)代表値の立体化
代表値に高さ方向が比例した直方体による立体化表示(データの立体化)を行う。図5に立体化表示(処理)を行った画像を示す。図5は立体化画像を真上から見た状態であり,データは立体的な値を持っているが,視覚的には立体化の様子を知ることができない。

図5 代表値立体化画像
(5)マンマシンシステムの組み込み
立体化した画像を理解する方法として,斜め上方向から眺めた状態の画像を表示する方法がある。しかし,この方法では前方のオブジェクトにより後方のオブジェクトが隠蔽されてしまう場合がある。そこで,得られた立体画像をより視覚的に理解しやすくするため,マウスドラッグにより自由回転できるようマンマシンシステムの組み込みを行った。マンマシンシステムを組み込み,表示した画像を図6に示す。

図6 マンマシンシステム組み込み画像
3.5 まとめ
本研究では,NDVIを可視化するシステムの開発を行った。本システムは,マンマシンシステムを組み込みことにより,計算機を専門とするもの以外でも容易に操作することが可能である。なお,本システムは開発段階のため,今後,システムの拡充とマンマシンシステムの改良を行う予定である。