豊田英司
toyoda@gfd-dennou.org
この文書は htroff の典型的使用法を、 なるべく簡潔をこころがけて説明します。 読者には WWW と UNIX または MS-DOS (Windows の MS-DOS プロンプトでも可) に 親しんでいることと、HTML についての若干の知識が期待されます。 さらなる htroff の動作の詳細は「htroff リファレンスマニュアル」( htroff.htm ) で説明されています。
htroff は HTML を生成する roff に似たソフトウェアです。 古来 roff の互換ソフトウェアはデバイス名を頭に冠して psroff, ditroff などと称するのが慣例のようなので、 HTML の先頭の2文字を取って htroff と命名しました。
roff は一群の組版ソフトウェアの名前です。 UNIX には写真植字機のためのファイルを出力する troff と テレタイプのような機械のためにプレーンテキストに 近い出力を出す nroff があります。 また、GNU プロジェクトでは groff というものを作っていて、 これはポストスクリプト出力ができたり日本語パッチが出たりしています。
いまでこそ roff は TeX などとくらべてもあまり流行りませんが UNIX のオンラインマニュアルは roff の man マクロパッケージを使って 書くことになっています。 このマニュアルをうまく HTML に変換したかったのが、 htroff を作ろうと思ったきっかけです。
作者の不勉強・力不足に由来するいろいろの非互換性はありますが、 ぼちぼち roff らしいものはできたと自負しております。 互換性に関する目標は
マクロパッケージを行儀良く使った roff ソースが共有できることです。
なお作者不勉強につき元祖 roff のちゃんとしたマニュアルを 見たことがありません。 したがって roff の挙動と称するものは利用例・関連文書・実験結果 などからの推測が多分に混じっています。 もし間違いなどありましたらお知らせいただけると幸いです。
htroff は roff の入力から HTML を生成します。 普通はその入力をファイルにしておくでしょうから、 これをコマンドライン引数 (ひきすう、``htroff'' の後に書く文字列) にして起動すれば htroff はそのファイルを読みに行きます。 なお入力ファイルは複数指定できます。 標準入力を指定するにはファイル名のかわりに - を用います。 たとえば file.inを入力ファイル名とすると
$ htroff file.inというコマンドによって生成された HTML が標準出力にでてきます。
出力をファイルに書き出すためにはリダイレクト(1)するか、 -o オプションを使います。たとえば出力を output.htm に変更するには
$ htroff -ooutput.htm file.inとします。 -o と output.htm の間に空白を入れないでください。
htroff の使い方は基本的にはこれだけなのですが、 後述するマクロパッケージというものを使う場合は -m オプションを使います。たとえば ms マクロパッケージを使うならば
$ htroff -ms -ooutput.htm file.inman マクロパッケージを使うならば
$ htroff -man -ooutput.htm file.inとします(2)。
footnote:
(1) リダイレクトとはシェルが標準出力を画面出力のかわりに ファイルに出力するように指定することです。 普通はコマンドの後に大なり記号 (`>') とファイル名を記述するのですが、 書き方によっていろいろ変わったことができるので、 シェルのマニュアルをみてくださいね。
シェルとは何かという疑問をもちますか? あなたが UNIX を使っているならコマンドに応答するプログラムの ことですから、普通にターミナルからログインした直後の状態だ といっておけばいいでしょう。 あなたが Windows を使っているなら シェルとは MS-DOS プロンプトのことだと思ってください。 なんだかよくわからないなら、ごめんなさい。 ちょっとこのドキュメントの範囲を超えます。
(2) ms マクロパッケージのための入力ファイル名は filename.ms のように .ms で終わるようにするのが普通です。 また man マクロパッケージのための 入力ファイル名は .man で終わるファイル名を使いますが、 man コマンドが使うために /usr/man などのディレクトリに置く場合には /usr/man/man1/htroff.1 のようにピリオドと数字で終わる名前をつけて章ごとの ディレクトリ (ここでは man1) に置かねばなりません。
ごく普通にプレーンテキストを書いただけのものも、 htroff の正当な入力です(3)。 たとえば次のようなテキストファイルを用意します。
In the beginning God created the heaven and the earth.
And the earth was without form, and void;
and darkness was upon the face of the deep.
And the Spirit of God moved upon the face of the waters.
And God said, Let there be light: and there was light.
これを htroff で処理した結果は
In the beginning God created the heaven and the earth. <P> And the earth was without form, and void; and darkness was upon the face of the deep. And the Spirit of God moved upon the face of the waters. <BR> And God said, Let there be light: and there was light.
のようになります。これを WWW ブラウザでみると
In the beginning God created the heaven and the earth. And the earth was without form, and void; and darkness was upon the face of the deep. And the Spirit of God moved upon the face of the waters.
And God said, Let there be light: and there was light.
のようにみえるでしょう。
まず重要なのは、ほとんどの場合入力の行はたがいにつなぎ合わされ (この操作を 行の追い込み fill-in といいいます)、 WWW ブラウザの幅いっぱいになるところで改行されることです。 この規則の例外は
です。
マクロパッケージを用いない場合は段落区切りは空行を用いましょう。 (ms マクロパッケージまたは man マクロパッケージを用いる場合は 段落区切りとしては .PP リクエストをもちいます)
footnote:
(3) LaTeX のように最初や最後におまじないは必要ありません。 なんてすばらしいんでしょう!
入力の改行がかならずしも出力の改行につながらないことは述べましたが、 その他にも少しだけ (幸いなことに TeX ほど多くはない) 入力したとおり出力されない文字があります。
- \ (逆斜線、バックスラッシュ)
- 行末にある場合、そのバックスラッシュは削除され、 その行はあたかも次の行とつながった1行であったかのように扱われます (継続行)。 それ以外の場合、 バックスラッシュの後に続く文字によっていろいろの機能を持ちます (エスケープシーケンス)。 知っておいてもよいと思われるエスケープシーケンスを下表にまとめます:
- 行頭の . (ピリオド)
- 行頭の ' (単引用符)
- これらのある行は リクエスト と呼ばれ、 ピリオドや単引用符のあとの文字によって いろいろな機能を果たします。 たとえば、行頭に ".br" と書いた場合は .br リクエストと呼ばれ、その位置での改行を指示するものです。
リクエストには htroff 本来の機能である 組み込みリクエスト と マクロ があります。 組み込みリクエストは主に物理的スタイルを指定するものがほとんどで、 htroff と troff や groff などの互換性はあまり高くないので 本文書で紹介しなかった 組み込みリクエストは文書に使用しないことを勧めます。 かわりにマクロパッケージ (後述) に含まれるマクロを用いて より論理的なマークアップを心がけてください。
表: エスケープシーケンス
エスケープシーケンス 機能 \& 長さ 0 の文字列 (行頭にピリオドを書くためなどに利用) \e バックスラッシュ文字自体を印字 \- ダッシュ (`-' 自体で表示される ハイフンより長い横線の句読点) を印字 \fB 以下の文字を太字にする \fI 以下の文字を斜体にする \fP 太字または斜体の指定を取り消し、直前のフォントに戻す "\ " (バックスラッシュとスペース) 隙間埋めに用いるスペース
roff のコメントはどうやら「\" 以降行末まで」らしいのですが、 多くのドキュメントはなぜか「行頭に .\" を書く」ようにしています。
プログラム断片を引用するときなど、 入力したとおりに出力してほしいものです。 まず行の追い込みを止めるには、 .nf リクエストを用います。このあと .fi リクエストが現れるまで行の追い込みが止まります(4)。
バックスラッシュ (エスケープ文字ともいう) を出力させるためには、 \e のように書きます(5)。
行頭にピリオドまたは単引用符があると リクエストになってしまうのを防ぐには、 \& を行頭に挿入してください(6)。
また、これは htroff だけの問題 (バグ) ですが、 .nf をしない (行の追い込みが行われる) 状態で スペースをいくつかならべても ひとつのスペースと同じ表示になってしまいます。 これを防ぐにはおのおののスペースの前に \ を挿入してください(7)。
少し実例をあげておきましょう。
以上のような入力は以下のような出力をうみます:
プログラム言語 C の教科書の最初によく出てくるのは 以下のような例である: .\" 以下は行の追い込みをされると読みにくくなる .nf #include <stdio.h>int main() {
printf("Hello, World!\en");
return 0; } .fi これは Kernighan and Ritchie の有名な....
プログラム言語 C の教科書の最初によく出てくるのは 以下のような例である: #include <stdio.h>これは Kernighan and Ritchie の有名な....int main() {
printf("Hello, World!\n");
return 0; }
footnote:
(4) ms マクロパッケージを用いるときは、 .nf, .fi のかわりに .DS, .DE を用いてください
(5) 多くのプログラム言語のように \\ のように記述しても多くの場合同じ結果になるのですが、 リクエストの引数 (後述) などではうまくいかないことが あるので使用を避けてください。
(6) もっとも、そんなことをする必要があるのは roff に関する文章を書くとき くらいのものですが。
(7) もっとも、行の追い込みをしておきながらスペースの数を保存する必要が あるとは思えないのですが。
マクロ と呼ばれる機能を使って、既存のリクエストや任意のテキストを組み合わせた 新しいリクエストを作ることができます。 といっても通常のユーザにとってマクロを自分でつくることはまれで、 できあいの マクロパッケージ というものを使う場合が多いでしょう。 元祖 roff や groff などの処理系には少なくとも man, ms, me の 3 つのマクロパッケージが付属しているようですが、 htroff ではそのうち比較的よく使われる (と作者が判断した) man と ms を実装しています。
man マクロパッケージは UNIX のオンラインマニュアル (マニュアルページ man page(s) という) が用いているマクロパッケージです。 現在でも UNIX で動作するプログラムを作るときは man マクロパッケージを 使ったマニュアルをつけるのが普通ですから、 おそらく多くのプログラマにとって roff を学ぶとは man マクロパッケージを 学ぶことにほかならないでしょう。 詳しくは man-7.htm も見てください。
たとえばマニュアルページのソースはこんなふうになっています:
.TH htroff 1 1999/01/11 "TOYODA Eizi" .SH 名前 htroff \- HTML ドキュメントを作るための roff もどき .SH 書式 .B htroff [ .BI -m macro ] [ .BI -o output ] [ .BI -r number = value ] [ .BI -d string = value ] [ .BI -q user_option ] [ .BI - user_option ] [ .IR files ... ] .SH 説明 .PP htroff は HTML を生成するための troff に似た .BR perl (1) スクリプトです。 ... (後略) |
マニュアルページの (コメントを除いた) 先頭は .TH マクロの呼び出しで始まります。 なお、tbl(1) などのプリプロセッサを用いる場合は第1行をコメントとし '\" t などとしてプリプロセッサを指定します。 この部分は roff ではなく man コマンドが解析して 適切なプリプロセッサを起動します。
.TH マクロを呼び出す際には .TH に続けてなにやら文字を 書かなくてはなりません。このようにマクロ名に続いて記述する文字列を マクロの引数 といいます。 引数を空白で区切って第1引数、第2引数と呼んだりします。 空白を含む文字列をを指定するには、二重引用符 (") で囲みます。 たとえば上の例では `htroff' が第1引数、`TOYODA Eizi' が第4引数です。
.TH マクロの第1引数はそのマニュアルページの名前です。 コマンドリファレンスならば 原則としてコマンド名がページの名前となります。 第2引数は章の番号(8)です。 第3引数は更新日付、 第4引数はドキュメンテーションのソース(9)を表すとされています。
.TH マクロの呼び出しの後は 通例では下表のような節で構成されます。 節のはじめでは .SH コマンドを用いて最初の節の見出しを表示させます。
表: マニュアルページの構成
英語 日本語 意味 NAME 名前 コマンド名とダッシュに続いて1行説明 SYNOPSIS 書式 利用方法の形式的説明 DESCRIPTION 説明 説明 OPTIONS オプション コマンドのオプション BUGS バグ 既知の問題点 SAMPLE OPERATION 利用例 コマンドの利用例 AUTHOR 作者 著作権情報
節ごとに書き方がある程度決まっています。
NAME 節はたった一行の中身からなります。 コマンド名、ダッシュ (`\-' と記述する)、 それに引き続いて1行の説明を記述します。 これは man コマンドの -k オプションで利用されます。
SYNOPSIS 節はコマンドの書式を形式的に記述します。 たとえば省略可能なオプションは角カッコ [ ] で表わします。 文中では太字と斜体の使い方に 慣例があります。 文字通りタイプせねばならない文字列は太字で、 文字通りタイプしてはならない文字列は斜体で表わします。 文字を太字にするには .B を、斜体にするには .I を用います。 また前半が太字で後半が斜体な語は .BI マクロにふたつの引数を 与えます。
他のマニュアルページの引用は 太字の名前と括弧つきの章番号で表わします。 たとえば passwd(1) は 1 章の passwd すなわち passwd コマンドのマニュアルへの参照を表わします。 これに対して passwd(5) は passwd ファイルの形式の マニュアルへの参照を表わします。
主に OPTIONS 節で必須の機能となりますが、
|
これに関係なくインデントを深くするには .DS, .DE マクロで インデントしたい段落をはさんでください。
footnote:
(8) 章の番号は UNIX の種類によって微妙に異なりますが、だいたいは 1:ユーザコマンド、8:保守コマンド、2:システムコール、 3:ライブラリ関数、5:ファイル形式、7:roffマクロパッケージ というようになっています。
(9) ソースとは情報源という意味で、私は自分の名前を書いています。
例示した配布元 URL はかならずしもふさわしくないかもしれません。
htroff はフリーソフトウェアたることを意図して作成されています。 配布条件は添付の COPYING.TXT ファイルに書かれています。