熱帯域降雨の鉛直分布の定量的観測は, 大気の潜熱による加熱高度の推定に対し重要である. その一方で熱帯域は, 地上観測網の貧弱さから 全球規模の降水の定量的観測は困難であった. 衛星からのリモートセンシングは熱帯域の地球規模での気象観測を行うことのできる唯一の手段である. 現時点では唯一, TRMM衛星に搭載されるPRが宇宙から降雨の鉛直構造を観測できる. 図1.1にTRMM衛星の外観, 図1.2にPRの観測概念を示す. PRは地上へセンチメートル波を放射し, 降雨粒子による後方散乱を受信する. その受信電力から降雨の鉛直分布を導出する.
図1.1: TRMM衛星の外観. NASDA(2000b)より取得. |
図1.2: PRによる観測手法の概念図. NASDA(2000b)より取得. |
このような背景をふまえ, NASDAから発行される, TRMM/PRが観測した降雨の格子点データに注目する.
地球科学分野において扱われる数値データは大規模かつ多様で研究者はその処理に多大な労力を払わなくてはならない. またデータ自身の情報がデータ以外の媒体に付随していることもある. これらは研究の作業効率を著しく妨げる. Macintosh(R)やWindows®に代表されるGUIベースのOSはファイルの拡張子がシェルに登録されていて, ユーザーはファイルを表現するアイコンをマウス等で選択することでシェルはそのファイルと関連付がなされているアプリケーションを立ち上げる. 利用者がデータの詳細な情報を知らなくてもデータ自身にその情報が書き込まれている, そのような単一のデータフォーマットが業界に浸透すれば研究の作業効率は飛躍的に高まる. 電脳davisプロジェクトはこのような背景の下, 日々精力的な活動が行われている.
本論文で使用する可視化・解析ツールgtool4は電脳davisプロジェクトの成果の1つである.
本論文は, 以下で構成される. 2章では「TRMM Rain Data set」の特徴, 仕様および構造についてまとめる. 3章では可視化・解析ツールgtool4の機能と設計思想, gtool4形式のデータの特徴とnetCDFおよびgtool4規約の特徴, およびgtool4ツールとその利点についてまとめる. 4章ではTRMM/PRで観測された熱帯域の月積算降雨量をgtool4を用いて可視化した図を示す. 5章は本論文のまとめである.
1章で述べたように,
既存の衛星による観測機では降雨の鉛直構造は観測できなかった.
このデータセットにはTRMMの現時点で唯一の衛星搭載降水レーダPRによって観測されたデータを格納されている.
これによって熱帯全域における鉛直方向の降雨プロファイルを導くことができる.
今回用いたデータセットは格子点データである. NASDA(2000a)によると, 元々のデータは格子点データではなく, PRがスキャンした衛星軌道上の瞬時値に緯度経度情報等を付加したデータである. このデータはASCII形式に展開すると軌道1周分で約350MBほどの大きさとなる. TRMM/PRは解像度が高いのだがそれに伴いスキャンできる範囲も狭いため, 全球がカバーされるほどのデータを得るには約10日間のデータを足し合わせる必要がある. TRMMは1日で地球を16周するので, 全球のデータ量は膨大なものとなる. これはある特定の時刻における観測値を知りたいときには良いが月積算降雨量などある程度長い時間スケールでの値を見積もるような時には非常に扱いにくい. そのためこのデータセットでは付加される緯度経度情報から対応する格子点を求め, それぞれのセルに値を格納し格子データとしている. こうすることでデータサイズを小さく, かつ取扱を容易にしている.
このデータセット内に格納されるデータの形式は2byteのバイナリデータである. 本来, TRMM衛星は観測するデータの標準フォーマットとしてHDF(Hierahical Data Format)と呼ばれるデータフォーマットを地球観測衛星データ用に拡張したHDF-EOS形式を採用している. HDFは米国イリノイ州立大学のNCSA (National Center for Supercomputing Applications)が開発したフォーマットで「階層的データフォーマット」と訳される. その特徴は「階層的」という名称が示すようにファイル内部にディレクトリ構造を持ち, 各々の変数を分類してファイル内に格納できることである. だがHDF形式のデータは入出力ライブラリ等の取扱いが難しく,手軽に利用するというわけにはいかない. そのためこのデータセットでは元のTRMMデータをバイナリデータにして格納している. こうすることで利用者は特別なライブラリや知識を導入することなく, 格納されるデータを読むことができる.
ヘッダは80文字×7行の大きさである. それぞれの行には以下に示す内容の文字配列が格納されている.
1行目: | データ種別 |
2行目: | アルゴリズム |
3行目: | 作成者 |
4行目: | データの期間 |
5行目: | 緯度範囲 |
6行目: | 経度範囲 |
7行目: | 格子数 |
データ部には月間降雨量データが2byte INTEGERで格納されている. 各変数はデータ部の先頭から以下の順に格納されている. 図2.1にファイル内部の変数の格納構造の模式図を示す. なお()内の記号は図2.1における各データを表す.
ヘッダ部 | データ部[pr_0] | データ部[pr_2] | データ部[pr_4] | データ部[pr_6] | データ部[pr_c_2] | データ部[pr_c_4] | データ部[pr_c_6] | … |
図2.1: データ内部の構造の模式図. 左端がファイルの先頭である.
TRMM/PR/Global algorithm:NASA TRMM/PR 3A25 create:NASDA time:2000/1 Lat:38S--38N Lon:0E--180--0.5W grid:720x153; (1,1)=(0E,38S) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 210411716 2 0 0 0 0 1 0 0 0 0 0 0 0 0 114 036232333341841201121 1 4 5 5 2 1 3 0 0 0 0 0 411 4 714 1 3 0 3 0 8 0 0 0 0 0 0 0 3 7 6 41112 61319 8 84316 4 0 6 81231 2 2 0 0 0 0 0 111 411 6 0 7 0 0 0 0 0 0 0 0 0 0 4 51413 911 6 627 2 8122231 8 3 125 211 0 0 0 0 4 0 0 022 9 0 0 1 6 210 0 4 7 0 0 0 0 0 9 617 61123 1 916 951 7121114 5 1 1 5 3 2 0 0 0 0 0 0 0 0 2 0 0 0 3 1 0 0 110 0 016 0 1 9 2 2 213 828 820 3 9 22010 2 111 3 1 5 8 0 0 0 0 0 0 1 0 1 0 0 0 0 3 0 0 0 0 0 0 0 0 0 6 0 513 217 0 4 3 3 7 222 410 1 0 2 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 1 0 3 6 014 2 1 3 3 11224 3 1 0 140 3 0 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 017 0 3 0 8 1 5 0 8 1 2 2 236 33120 0 5 0 1 211 4 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 6 3 0 0 0 316 5 1 42021 2 1 0 11010 5 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 017 1 2 0 22520 211 3 2 0 033 312 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 4 2 1 5 1 1 512 212 5 4 114 3 2 2 1 8 138 0 0 0 0 0 ... 以下省略 |
図2.2: バイナリデータから数値を取り出しASCII形式で出力するF77のプログラム. |
program rd_gpr character*80 header(7) character*80 fname integer*2 pr(720,153) integer*2 pr_2(720,153) integer*2 pr_4(720,153) ... 中略 ... c fname='gpr00100' open(80,file=fname,status='old',form='unformatted') read(80) header read(80) pr read(80) pr_2 read(80) pr_4 ... 中略 ... write(*,*) header do j=153,1,-4 write(*,'(200I2)') (pr(i,j)/10,i=1,720,12) end do |
図2.3: 図2.2の出力を得るプログラム |
gtool4は
Fortran90で書かれているために, 地球科学分野の研究者がプログラム・ソースのレベルから理解しやすい.
例えば既存のツールに新しい機能を付け加える際に新しくプログラムを作成するのは手間がかかる. その場合, 追加機能をオブジェクトとして元のプログラムに付け足すだけならば, 効率が良い. そのためgtool4ではオブジェクト指向設計を心がけている.
フリーウェアであることとソースの公開は, プログラムの改良を促進する上で有効である. またフリーであることで研究者のみならず学生が個人レベルで自由に使いこなせることで業界標準で利用されることが期待できる.
地球惑星科学分野において流通する, 既存の数値データフォーマットは, そのデータ自身の諸元や格納される変数の情報等がデータ以外の媒体に書かれている. gtool4形式のデータはデータ自身の性質・情報がデータ自身に内包されている. これにより利用者は, データの詳細が書かれているマニュアルを探すことなく, データ単体で作業を進めることができる.
エンディアン形式, 浮動小数点方式などの数値データの機種間の取扱の違いはデータ共有時の足枷となっている. gtool4ではデータ形式に機種に依存しない様式をを採用している. これにより異なる機種間でネットワークを通じてデータの流通と正確な伝達が可能である. またツールが数値データを参照する際にネットワーク上で共有される資源に直接アクセスすることを考慮し, データの参照名にURI(Uniform Resource Identifiers)を採用している. このようにネットワーク経由でのデータ流通がスムーズに行われることを目標にgtool4ではネットワーク透過性を重視している.
地球科学分野では数値データは可視化されることを前提としている. 数値データの可視化情報を同じファイル内に格納できれば, 過去に自分の作成した図形が確実に再現できる. gtool4では構造体変数という概念を採用し, 可視化情報を変数として元となる数値データに格納することができる. これはgtool4を開発した電脳davisプロジェクトの目指す数値データの構造の最大の特徴である.
上記の特徴を実装の上で重要な位置を占めるのが,gtool4形式のデータの基礎フォーマットであるnetCDFである. 次節ではnetCDFについて詳しく説明する.
netCDFは本来Unidataが自身で提供するアプリケーション共通のデータフォーマットとして開発されたが, 現在では大気科学分野で広く活用されている. 例えばCDC(Climate Diagnostics Center)から配布されている NCEP/NCAR再解析データ は,全てnetCDF 形式になっている. また大気科学以外の分野でも利用されている. 地図作成ツールGMT(The Generic Mapping Tools)がその1例である.
現在代表的なnetCDF規約としては COARDS規約, NCAR CMS規約, GDT規約が挙げられる. それぞれの規約は規定する団体の研究する分野の事情を反映している. 例えば上述のCOARDS規約は気候・気象データを想定した規約であり, NCAR CMS規約は特に気候数値モデルを想定して開発された規約である.
gtool4規約は多次元数値データと可視化情報を自己記述的に格納することにに焦点がおかれた規約である. 言い替えるとgtool4の特微である可視化情報と数値データの統合, ならびにデータの構造化はgtool4規約によって成立しているのである.
図4.1: 2000年2月の地表面における月間降雨量の緯度-経度断面図. |
図4.2: 2000年8月の地表面における月間降雨量の緯度-経度断面図. |
図4.3: 2000年2月の高度2 kmにおける月間降雨量の緯度-経度断面図. |
図4.4: 2000年8月の高度2 kmにおける月間降雨量の緯度-経度断面図. |
図4.5: 2000年2月の高度4 kmにおける月間降雨量の緯度-経度断面図. |
図4.6: 2000年8月の高度4 kmにおける月間降雨量の緯度-経度断面図. |
図4.7: 2000年2月の高度6 kmにおける月間降雨量の緯度-経度断面図. |
図4.8: 2000年8月の高度6 kmにおける月間降雨量の緯度-経度断面図. |
図4.9: 赤道上の地表面における月間降雨量の経度-時間断面図. 期間は1998年1月から2000年12月まで. |
図4.10: 東経100度の地表面における月間降雨量の緯度-時間断面図. 期間は1998年1月から2000年12月まで. |
図4.11: 2000年2月の赤道上における月間降雨量の経度-高度断面図. 東経100度から東経150度までの範囲を図示. |
図4.12: 2000年2月の東経100度における月間降雨量の緯度-高度断面図. |
「TRMM Rain Data set」は熱帯域降雨の3次元空間分布を格子点データとして格納している. 降雨の3次元空間分布は大気の潜熱による加熱分布を知る上で重要である. また, 取扱の難しいTRMM衛星の標準データフォーマットであるHDF形式ではなく, 汎用のバイナリフォーマット形式を採用している. そのため衛星データの扱いに不慣れな研究者が利用しやすい仕様となっている. 一方でバイナリ形式は非自己記述的なデータなために, 大量のデータを扱う際には手間もかかり, 使い勝手が悪い.
上記の問題はgtool4を利用することで解決される. 「TRMM Rain Data set」のデータ構造を持つnetCDFファイルをgtool4規約にしたがって作成すれば, 変数の単位や空間構造に関する情報をファイル自身に内包できる. また機種依存しないデータ形式はネットワーク上でのファイル共有を容易にする. さらにgtool4の可視化機能を利用して, 簡単に変数の断面図を作成することが出来る.
本論文では熱帯域降雨特性の把握に必要なデータの解析作業や気象力学的な理論づけなどは行っていない. データセットから得られた降雨分布データの緯度平均や時間平均の導出, および地表面からの外向き長波放射分布やSST分布と相関をとるなどして, これらの示す性質の理解を深める必要がある.
まず初めに指導教官である林 祥介教授, 小高 正嗣助手に深く感謝します. お2人には本論文のテーマのきっかけを与えて頂き, 論文の内容全般に渡ってご教授いただきました. 地球流体力学研究室の高橋 こう子さん, 山田 由貴子 さんには本論文の文章添削から論文全体の構成に至るまで, 親身にご指導頂きました. その他, 研究室を問わず多くの地球科学科の先輩方および4年生から様々な知見および励ましの言葉をいただきました. この場を借りてお礼申し上げます.
本論文中の熱帯域降雨分布の観測データはNASDA発行の地球気候変動研究のためのCD-ROM,「TRMM Rain Data Set TMI(1999-2000),PR(1998-2000)」,ftp://ftp.eorc.nasda.go.jp/cdroms/ESRDC-007/を使用させて頂きました. また図の作成には地球流体電脳倶楽部開発によるGtool4 Fortran90 tools, http://www.gfd-dennou.org/arch/gtool4/を使用させて頂きました. 開発者の方々に感謝します.