欠損値

 

自然を相手に観測などする場合, 観測機器の不調等により正常にデータが取れない場合がある. そのような場合, 本来データを書くべきところに, 特定のある数値 (例えば999.) を書いて, 正常にデータが取れていないことを示すことがある. この「正常なデータでない」ことを意味する数値が欠損値である. DCLの多くのパッケージでは, このような欠損値を含むデータを直接扱うことができる.

例えば, 次のようなデータがあったとしよう.



日最高気温の月平均値  
$\backslash$観測点 札幌 仙台 東京 名古屋 京都 福岡 鹿児島
1月 -1.1 5.0 9.5 8.4 999. 9.3 12.2
7月 24.8 25.6 28.8 999. 999. 30.6 31.4



1月の京都, 7月の名古屋, 京都の 999. は データが正常に得られなかったことを示している. 1月, 7月それぞれの月のデータを配列T1, T7に読み込んで 平均値を算出するとき, 999. まで有効なデータとして扱ってしまうと, とんでもない値が算出されてしまう. そこで, 以下のように DclGetParm/DclGetParmが管理する内部変数 'INTERPRET_MISSING_VALUE'.TRUE.として(初期値は.FALSE.) 関数DclGetAVEを用いれば, 999. を除いた平均値が算出できる.

      call DclSetParm('INTERPRET_MISSING_VALUE', .true.)
      tave1 = DclGetAVE(t1)
      tave7 = DclGetAVE(t7)

欠損値処理をおこなうことができる関数では, すべての配列要素が欠損値のときは欠損値が返される.

なお, 配列T1T7の和をTXとして求めるときは,

      call DclGetParm('MISSING_REAL', RMISS)
      where(T1 == RMISS .or. T7 == RMISS)
          TX=RMISS
      elsewhere
          TX=T1+T7
      end where

としてやればよい. T1およびT7の配列要素の少なくとも どちらかが欠損値ならば欠損値を返すので, この場合, 名古屋, 京都に対応するTXの配列要素は 欠損値となる.


欠損値は DclGetParm/DclGetParmが管理する内部変数 'MISSING_REAL'(実数型の場合)/'MISSING_INT'(整数型の場合) で指定され, 初期値は 999. および 999 である. 999. という値は, 気温としては本来ありえない値なので, 気温データなどの場合には問題はないが, この値がデータの範囲に入ってしまうような場合には, 'MISSING_REAL'の値を変更しておく必要がある.

 

関連項目