Up|<<Prev|Next>>


1.9 NetCDFの制限

NetCDF データモデルは名前付き属性を持つ名前付き配列変数の集合として系統だてられるデータに関しては広く応用が利きます。しかしながらこのモデルとソフトウェアの実装にはいくつかの重要な制限があります。 この制限の一部はNetCDFが包含する要求の中で相反するものに対するトレードオフに内在するものであります。他の制限に関しては次のバージョンにて対応していく予定です。

現在 NetCDF で使用できる外部数値データ種は 8-、 16-、 32-ビットの整数、 32-もしくは 64-ビットの浮動小数点数 に限られています。これらの限られたサイズはビットフィールドにデータを格納することに比べるとファイルスペースを無駄に使用する可能性があります。例えば、 9-ビットの数値の配列は16-ビットの短い整数として格納しなければなりません。1-、2-ビット長の数値を8-ビット長の値として格納するのは更に無駄が多くなります。

現行の NetCDF ファイルフォーマットでは一つのNetCDFファイルに格納できるデータは 2ギガバイトです。この制約はファイル内の配置格納の為に32ビットオフセットを使用しているために生じています。

現行のモデルの制約の一つに各NetCDFファイルに対して無制限の(可変の)次元が一つしか使用できないことです。 無制限の次元においては複数の変数を共有することが可能ですが、それらの変数は同時に発展しなければなりません。これによってNetCDFモデルでは同一ファイル内において複数の無制限次元を持つ変数を扱ったり異なる変数に複数の無制限次元を持たせることができません。つまり、NetCDFモデルは矩型でない変数(例えば不揃いな配列)の表現には不向きということになります。

データの完全な自己表現性にも限界があります。 実際にデータを共有したり格納したりする際には必ずと言って良いほど既存の決まり事が存在します。 NetCDFでは変数・次元・属性に意味のある名前、計算する際に使用可能な形態の単位、ファイル全体に関する属性値のテキストストリング、簡単な座標系に関する情報を格納出来ます。 しかし、より複雑なメタデータ(例えば一般的ではないグリッド上に正確に地球座標系のデータを投影したり衛星からの映像を正確に表現するために必要な情報等)に対応するためには慣習を敷く必要がでてきます。

NetCDFデータモデルに適切な修正を加えることによりこれらの慣習が不必要になったり、メタデータの幾つかの種類を統一的かつコンパクトな方法で表現できるようになるかもしれません。例えば、NetCDFデータモデルに明確な 地球座標系を与えることによって複雑な地球座標系の慣習を簡易化することは可能ですが、データモデルが複雑になるという弊害があります。ここで問題となるのはモデルの豊かさと汎用性(多種多様なデータを扱える能力)との間に適切なトレードオフ地点を見つけることです。ある特定の分野の研究者同士が共有する概念を表すためだけに作られたデータモデルは複数の分野でデータを共有したり統合したりすることには不向きかもしれません。

NetCDFデータモデルはツリー・ネスト配列・ 循環的なデータ等のネスト型配列構造をサポートしていません。その最たる理由は現行のFORTRANインターフェースによって任意のNetCDFファイルを書き込み読み取れなければならないからです。複雑な表現方法や慣習によって、幾つかのネスト型構造を表現することは可能ですが、その結果、NetCDFの目標である自己記述型データではなくなってしまう可能性があります。

最後に、 現行の実装ではNetCDFファイルへの同時アクセスは制限されています。一つのファイルは同時に複数の人が読み取ることが出来ますが、書き込める人は一人に限られており、複数人による同時書き込みはサポートされていません。


Up|<<Prev|Next>>