計算機のなまり 3
文字の内部表現文字の内部表現も実数表現と同様に機種に依存しています.DCL の CHGLIB と CHKLIB のサブパッケージは,機種依存する文字処理を規格化するためのもの です.
FORTRAN では以下の FORTRAN 文字集合が定められており,プログラムは,注 釈行や文字型データの中は例外として,これらの文字だけで書かなければなり ません.
英字: ABCDEFGHIJKLMNOPQRSTUVWXYZ 数字: 0123456789 特殊文字: 空白 !'() *+,-./:=! 通貨記号したがって,小文字で FORTRAN プログラムを書くのは厳密に言えば文法違反 になります.
これらのFORTRAN文字を含めて,文字の内部表現方法はFORTRANの規格では特に 規定されていません.文字の内部表現方法は実数の場合と同様に,IBM規格で あるEBCDICと,アメリカの標準規格であるASCIIとに大別されます.
EBCDIC は,IBM によって定められた拡張2進化10進情報交換用コード (Extended Binary Coded Decimal Interchange Code)です. 富士通,日立な どのいわゆる IBM 互換の汎用機でも採用されていますが,各社で微妙に定義 が異なります.富士通のコードには,IBM規格以外の制御コードも定義されて おり,日立のEBCDIK(最後のKはカナ)ではアルファベットの小文字のコードが 異なります.
ASCIIコードはアメリカ規格協会(ANSI)で規定された文字コード体系です. UNIX, MS-DOS などで採用されている文字コードです.日本では,ほぼ同じも のがJIS X0201として規定されています. ASCII コードは7ビットで,最上位 桁は0ですが,JISには8ビット全部使ってカタカナまで規定した8単位符号表が あります.
詳細は,MISC1 のマニュアル(dcl-x.x/doc/misc1/gaiyou/char.tex)を御覧下 さい.
NUMAGUTI Atusi <a1n@gfdl.gov> Last Modified: Thu Aug 31 13:11:11 EDT 1995