情報基盤研究グループ(IIRG)研究状況



東京情報大学 布広 永示, マッキン ケネスジェームズ,朴 鍾杰,松下 孝太郎,山口 崇志,花田 真樹 浅沼 市男,原 慶太郎
日本大学 五十嵐 正夫,柳澤 幸雄

1.はじめに



情報基盤研究グループでは,広域衛星データ(NOAA, MODISデータ)に関する情報を発信するための衛星画像データ解析システム (SIDAS : Satellite Image Data Analysis System)の開発,SIDASのシステム性能を向上させるための高性能コンピューティング技術の研究,そしてMODISデータを利用した災害マップの作成,土地被覆変化の抽出などの解析手法の研究を進めている。本報告では,「時系列データに潜在的に存在する周期性」,「SIDASのネットワーク監視・解析ツール」の研究状況について報告する。

2.時系列データに潜在的に存在する周期性の研究  (柳澤 幸雄)


2.1 長周期の抽出
時系列データには、季節ごとにおこる現象や、あるいはもっと短期間に繰り返しがある現象、数年、数十年、数百年以上の周期をもつ現象、またこれらの周期とは全く関わりなく、無関係に偶然起こる現象が複雑に絡みあっていると思われる。時系列データは、時間的な経過により変動する連続な非線形関数と考えられ、ある条件の下でフーリエ級数は、任意の連続な非線形な関数に収束する。フーリエ級数の場合、無限個の直交する三角関数の線形結合として表せるが、実際のデータは離散的で有限個であるため、有限個の三角関数の線形結合として近似する。更に実際のデータには、誤差が加わっている為、有限個の三角関数の線形結合(モデル)の近似が良すぎることはかえって良くない。例えば、時系列データを観測した地点とその近くの地点では、かなり似通ってはいるが異なったデータが観測できるはずである。つまり、考えられるモデルが、観測された時系列のデータに当てはまりが良すぎることは、モデルが誤差に影響され、必要以上に複雑になる。そこで統計的な検定を行い、有意でない周期成分を削除し、適切なモデルを求める。更に、長周期成分のみをモデルから抽出すると、データに内在する長期的な変動が得られる。
図1はNINO1+2 (0度~南緯10度、西経90度~西経80度)における1950年より現在までの海水面の温度を図にした。赤い点はエルニーニョの起こった期間、青い点はラニーニャが起こった期間を表している。この図によると季節変動の影響が大きく、エルニーニョやラニーニャの影響は見られない。紙面の制約上割愛するが、有意な周期成分のみを用いたモデルは、観測された時系列データに非常に良く適合している。

図1  NINO1+2における海水面の温度
 図2は、推定されたモデルから1年以上の長周期成分のみを抽出し、その変化とエルニーニョやラニーニャの起きた時期を示した。エルニーニョが起きた時期は常に高い温度で、ラニーニャが起きた時期は常に低い温度を示している。これにより、エルニーニョやラニーニャが、海水温に大きな影響を与えたことが示された。

図2  NINO1+2における海水温の 長周期成分の変動
この方法をNINO3(北緯5度~南緯5度、西経150度~西経90度)、NINO4 (北緯5度~南緯5度、東経160度~西経150度)、NINO3.4 (北緯5度~南緯5度、西経170度~西経120度)における1950年より現在までの海水面の温度のデータに適用したところ、NINO1+2における結果とほぼ同じ結果が得られた。更にKains Island, British Columbia, Canada(西経129度、北緯50度)における1935年から現在までの海水面の温度のデータを解析したところ、赤道付近と比較し、エルニーニョやラニーニャの影響はそれほど大きくない。  この方法を種子島(1983~現在)と根室(1880~現在)における気温に適用すると、エルニーニョやラニーニャの影響を全く受けていないようである。
2.2 結論
有意な周期成分を用いたモデルは、観測データに非常に良く適合しており、長周期成分を抽出することで、長期的な傾向、エルニーニョやラニーニャの影響があるかが分かる。

3. SIDASシステムのネットワーク監視・解析ツール(花田 真樹)


 SIDASでは、これまでの研究成果を基に様々な可視化情報を配信・提供している。次期バージョンではエリア指定による可視化情報のオンデマンドサービス等が予定されている。本研究では、SIDASのネットワーク/システム状態を監視し、さらに、ユーザにどのような品質で提供されているかを推定する手法及びツールについて報告する。
3.1 ネットワーク品質要求
リアルタイムで可視化情報(画像情報)を配信するオンデマンド型のサービスでは、要求を受け付けてからある一定の時間以内にユーザへの配信を完了する必要がある。この「一定の時間」は、一般的に応答時間(ネットワーク遅延も含む)と呼ばれ、3秒以内に配信を完了する「3秒ルール」や8秒以内に配信を完了する「8秒ルール」などいくつかのルールが存在している。
3.2 SIDASシステムのネットワーク監視・解析ツール
過去の研究において,類似画像検索の広大な解空間を実時間で探索する為に,並列処理が可能なGAの拡張である分散GAを用いPCクラスタ上にシステムを構築した。現在はさらに類似画像検索アルゴリズムを高速化する為,探索手法の改善と転移学習の適用を検討している。
3.2.1 概要
3.1で述べたユーザの要求品質を提供するために、ネットワーク監視・解析ツールでは主に下記の2つの機能を提供する。
① ネットワーク/システム状態を常時監視する機能
② ユーザへ提供される品質を推定する機能
①の機能により、ネットワーク/システムが正常に稼動しているかを監視し、②の機能により、ユーザまでの配信にかかるネットワーク遅延を推定可能となる。これらの結果は、システム性能向上のために、システム設計にフィードバックされる。
SIDASのネットワーク監視システムの概要を図3に示す。ネットワーク監視サーバは、SIDASシステムにおける各サーバ(各機器)の入出力データ量、CPU使用率、空きメモリ容量を収集・監視する(①の機能)。さらに、ネットワーク監視サーバは、SIDASシステムのWebサーバから早稲田大学に設置した機器までの利用可能な帯域(可用帯域)を推定した結果を収集する(②の機能)。ネットワーク監視サーバは収集した情報を解析し、図4のような画面を表示する。画面の上部に推定可用帯域が表示され、下部の各サーバ(各機器)のリンクを押下するとそのサーバ(機器)の状態が詳細に表示される。

図 3 ネットワーク監視・解析システム

図 4 ネットワーク監視・解析ツールの画面
3.2.2 可用帯域測定手法
3.2.1で述べた②の機能では、可用帯域推定手法を用いて可用帯域を推定する。この手法の原理を図5に示す。まず、送信側からパケットトレイン(パケットの集合)を受信側に送信する。このとき、パケット間隔を とし、パケット長を とする。送信側で送信したパケット間隔 が、受信側で受信したパケット間隔 と一致する場合、可用帯域 は下記の式で表される。

しかし、ネットワークの利用状況により、パケット間隔 が変動するために、安定時のパケット間隔 を求める必要がある。これまでに、いくつかの可用帯域推定手法が提案されているが、推定精度が十分でない点や推定に多くの時間を要する点などが挙げられている。今後は、これらを改善した手法を提案・開発していく予定である。

図 5 可用帯域推定手法