自然を相手に観測などする場合,
観測機器の不調等により正常にデータが取れない場合がある.
そのような場合, 本来データを書くべきところに,
特定のある数値 (例えば999.) を書いて,
正常にデータが取れていないことを示すことがある.
この「正常なデータでない」ことを意味する数値が欠損値である.
DCLの多くのパッケージでは,
このような欠損値を含むデータを直接扱うことができる.
例えば, 次のようなデータがあったとしよう.
日最高気温の月平均値 | |||||||
月 観測点 | 札幌 | 仙台 | 東京 | 名古屋 | 京都 | 福岡 | 鹿児島 |
1月 | -1.1 | 5.0 | 9.5 | 8.4 | 999. | 9.3 | 12.2 |
7月 | 24.8 | 25.6 | 28.8 | 999. | 999. | 30.6 | 31.4 |
1月の京都, 7月の名古屋, 京都の 999. は
データが正常に得られなかったことを示している.
1月, 7月それぞれの月のデータを配列T1, T7に読み込んで
平均値を算出するとき,
999. まで有効なデータとして扱ってしまうと,
とんでもない値が算出されてしまう.
そこで, 以下のように
DclGetParm/DclGetParmが管理する内部変数
'INTERPRET_MISSING_VALUE'を
.TRUE.として(初期値は.FALSE.)
関数DclGetAVEを用いれば,
999. を除いた平均値が算出できる.
call DclSetParm('INTERPRET_MISSING_VALUE', .true.) tave1 = DclGetAVE(t1) tave7 = DclGetAVE(t7)
欠損値処理をおこなうことができる関数では, すべての配列要素が欠損値のときは欠損値が返される.
なお, 配列T1とT7の和をTXとして求めるときは,
call DclGetParm('MISSING_REAL', RMISS) where(T1 == RMISS .or. T7 == RMISS) TX=RMISS elsewhere TX=T1+T7 end where
としてやればよい. T1およびT7の配列要素の少なくとも どちらかが欠損値ならば欠損値を返すので, この場合, 名古屋, 京都に対応するTXの配列要素は 欠損値となる.
欠損値は
DclGetParm/DclGetParmが管理する内部変数
'MISSING_REAL'(実数型の場合)/'MISSING_INT'(整数型の場合)
で指定され, 初期値は 999. および 999 である.
999. という値は, 気温としては本来ありえない値なので,
気温データなどの場合には問題はないが,
この値がデータの範囲に入ってしまうような場合には,
'MISSING_REAL'の値を変更しておく必要がある.