テキストデータの記述方法
- Posted by: gnn • 2010/05/29
概要
このページは「テキストをEPUB/PDFに変換する」、「テキストファイルを本にする」サービスのためのテキストファイルの作成方法を解説しています。
一番簡単なテキストデータは次のようなものです。メモ帳などのテキストエディタで作成してください。全角文字、半角文字の区別に注意してください。文字コードはUTF-8を推奨します。先頭の //題名: という部分で書籍化用のテキストデータであることを識別していますので、省略しないでください。//は半角。:は全角です。
//題名:ここに題名 ここに本文
さらに、いろいろな情報を含めたり、章立てするような場合は次のような形式にしてください。
//題名:ここに題名 //著者:ここに著者名 //発行人:ここに発行人 //発行所:ここに発行所 ここに発行所住所 ここに発行所電話番号等 //情報:ここに(c)表記など //版情報:ここに版情報 #まえがき:ここに前書き題名 ここに前書き本文 **ここに大見出し ここに本文 *ここに小見出し ここに本文 **ここに大見出し ここに本文 *ここに小見出し ここに本文 #あとがき:ここに後書き題名 ここに後書き本文 #著者紹介:ここに著者名 ここに著者紹介本文
サンプル
以下のサンプルをテンプレートとして使ってください。
サンプルのテキストファイルをダウンロード 表示例: 横書き 縦書き
編集方法
テキストエディタを使ってください。TeraPad, MKEditor, EmEditor, OEdit, VXEditor あたりがおすすめです。
テキストエディタで1行あたり半角78文字を表示するモードで、おおむね20行が一般的な書籍(新書、ブックレット等)の1ページに相当します。80ページのブックレットを書くなら1600行、260ページの本なら5200行を目指して執筆してください。
文書情報
//(半角)で開始する行は、文書の基本的な情報で、必ず文章の先頭に記述してください。項目の内容が複数行にわたる場合は、改行して次の行の先頭に半角スペースまたはタブを入れて記述してください。
記述できる情報は次の通りで、「題名」だけが必須です。
発行所、情報、版情報は「テキストをEPUB/PDFに変換する」用です。「テキストファイルを本にする」では反映されません。
//題名
題名です。中表紙と奥付に表示されます。
//著者
著作権者です。中表紙と奥付に表示されます。
//発行人
出版社の社長の名前を書くのが一般的なようです。奥付に表示されます。
//発行所
出版社の法人名、屋号、住所、電話番号、ホームページ、メールアドレス、郵便振替口座等を書いてください。奥付に表示されます。
//情報
(c)表記等です。奥付の一番下に表示されます。
//版情報
発行日と、第○版といった情報です。奥付に表示されます。
章立て
**、*(半角)で開始する行は、それぞれ大見出し(章のはじまり)と小見出し(節のはじまり)です。生成されるEPUBファイルの内容は、小見出しごとに別のXHTMLファイルに区切られます。結果的に、見出しの前には必ず改ページが入ります。
電子書籍としての取り回しをよくするには、テキストエディタで1行あたり半角78文字を表示するモードで、100行程度、長くても200行以内で、章立てを区切ることをおすすめします。
特殊なセクション
#(半角)で開始する行は、特殊なセクション(まえがき、あとがき)のはじまりを示します。
字下げ
行頭に全角スペースを入れることで、字下げしてください。
2文字分以上の字下げをして、中央寄せや右寄せのようなレイアウトにする場合は、後述の方法を使ってください。
ルビ
螽斯《きりぎりす》のように、漢字の熟語の直後で、ふりがなを《》(全角)でくくって記述してください。《》は、「かっこ」と入力して変換することで出すことができます。
部分的にルビをふる場合は、山本|五十六《いそろく》のように|(全角)で区切ってください。
漢字以外(かな、欧文など)にルビをふる場合も、|entropy《エントロピー》のように|で区切ってください
複数の熟語で構成される場合は、大阪市《おおさかし》淀川区《よどがわく》のように熟語ごとにルビをふってください。
圏点
圏点[#圏点 ﹅]のようにしてください([]#および途中のスペースは全角です)。ルビと同様に、|おふくろさん[#圏点 ﹅]のように|(全角)で区切ることができます。﹅は圏点の種類を表す文字参照です。
圏点の種類ごとの文字参照は、こちらのページを参照してください。
縦書き
文章は、横書きを基本として作成してください。
縦書き用に変換される文字
PDFで縦書き表示される際は、以下の規則で自動変換されます。
- 全角数字(例:203)は漢数字(例:二〇三)に変換する。
- 2桁の半角数字は縦中横にする。
- 2桁以外の半角数字は全角数字に変換して縦向きにする。
- 全角欧文は縦向きにする。
- 半角欧文は横倒しにする。
- 全角“”(ダブルクォーテーション)を〝〟(ノノカギ)に変換する。
- http://~で始まるアドレスには上記の変換を適用しない。
以上の変換を避ける場合は、適用箇所を<span class="pre"></span>でくくってください。
縦書きで見栄えのよい本を作る場合は、以下の規則に従って作ることをおすすめします。
- 数字は漢数字で記述するポリシーの場合:数字は、熟語に含まれるもの以外は全角数字で記述する。どちらにするか迷った場合も全角数字。
- 数字は洋数字で記述するポリシーの場合:数字は、熟語に含まれるもの以外は半角数字で記述する。どちらにするか迷った場合も半角数字。
- NHKのような欧文の略語は全角で記述する。MI6のように数字を含む場合は<span class="pre">MI6</span>として変換を避ける。
- hyper textのような欧文の単語、フレーズは半角で記述する。the 6th senseのように数字を含む場合は<span class="pre">the 6th sense</span>として変換を避ける。
縦中横
縦書きの場合に、部分的に横書きにするには、適用箇所を<span class="tcy"></span>でくくってください。
XHTMLタグ
テキスト中ではXHTMLタグを使用可能です。なるべく、EPUBでサポートされることが保障されているXHTMLタグ(以下のリンク先に列挙されているタグ)だけを使用してください。
http://www.idpf.org/2007/ops/ops2.0/download/#Section2.2.1
タグは常に閉じてください。BR, HRのように単独で使うタグは以下のように記述してください。
悪い例× | よい例○ |
<br> | <br /> |
<hr> | <hr /> |
CSS 2.1 による多彩な表現が可能です。縦書き、横書きの変換規則等の詳細はこちらを参照してください。以下では、よくある例だけを解説します。
太字、斜体、大きな字、小さな字、上付き、下付き
それぞれ、b, i, big, small, sup, subタグを使ってください。
記述例:
テキスト<b>太字</b><i>斜体</i><big>大きな字</big><small>小さな字</small><sup>上付き</sup><sub>下付き</sub>
実際の表示:
テキスト太字斜体大きな字小さな字上付き下付き
引用
引用部分は、<blockquote></blockquote>でくくってください。その部分だけ枠でかこまれ、若干文字を小さくしたスタイルになります。次のように開始タグの前に2回、終了タグの後に1回改行を入れてください。開始タグの後と開始タグの前には改行を入れないでください。
...本文 <blockquote>引用 引用 引用</blockquote> 本文...
画像
現在のところ、画像のアップロード機能はありません。インターネット上のどこかに画像を配置していただく必要があります。画像はimgタグを使います。width, height, alt属性は、なるべく設定してください。
<img src="画像のアドレス" width="幅" height="高さ" alt="代替テキスト"/>
図表や単純な絵はPNG形式を使ってください。写真や複雑な絵はJPEG形式を使ってください。Adobe IllustratorやMicrosoft Visio等で出力できるSVGにも対応しています。
電子書籍は、手のひらサイズのスマートフォンや、電子ペーパーで読むことも想定する必要があります。現在普及している電子ペーパーはモノクロ4階調から16階調、150dpi程度で、ファックスのような画質です。写真、図表は、このような環境でも、何が写っているのか分かりやすいものにしてください。
悪い例× | よい例○ |
画像は中央に大きく表示するように配置することをおすすめします。以下はwidthで幅を画面幅いっぱい(heightを省略したので、縦横比を維持して高さが自動調整される)に、styleで別段中央に表示するようにしたimgタグの記述例です。
<img src="http://~/figure.png" width="100%" style="display: block; margin: 0 auto;" alt="図"/>
文中左寄せ、右寄せで配置する場合は、それぞれ以下のようにしてください。小さく表示される分、画像も見やすいものにしてください。
<img src="http://~/figure.png" width="幅" height="高さ"
style="float: left;" alt="図"/>
<img src="http://~/figure.png" width="幅" height="高さ"
style="float: right;" alt="図"/>
外字や絵文字のように文中に配置する場合は、次のようにしてください。画像が文字の基底線にそろうように調整されます。
<img src="http://~/emoji.png" class="emoji" alt="絵文字"/>
画像のキャプション
大きな写真にキャプションを付ける場合は、写真の中にキャプションの文字を画像として固めてしまったほうが、確実です。
あるいは次の形式で記述してください。
<img src="http://~/figure.png" style="display: block; margin: 0 auto; width: 100%;" alt="画像の説明"/><div style="margin-top: -1em; font: normal 75%/1 sans-serif; text-align: center;">キャプション</div>
この場合キャプションは、横書きでは画像の下、縦書きでは画像の左に表示されます。
スタイルシートによるレイアウト
右寄せ、中央配置
それぞれ、次のように記述してください。
<div style="text-align: right;">右寄せ</div>
<div style="text-align: center;">中央配置</div>
文字色、背景色
行中の文字に適用するにはつぎのように記述してください。
テキスト<span style="color: Red;">赤文字</span><span style="background-color: Yellow;">黄色マーカー</span>
表示結果:
テキスト赤文字黄色マーカー
箇条書き
番号付きの箇条書き、番号なしの箇条書きはそれぞれ次のように記述してください。読みにくいですが、余計な改行が入ってしまうのを防ぐために、改行を入れずに続けて記述してください。
<ol><li>項目1</li><li>項目2</li><li>項目3</li></ol>
<ul><li>項目1</li><li>項目2</li><li>項目3</li></ul>
見た目はそれぞれ次のとおりとなります。
- 項目1
- 項目2
- 項目3
- 項目1
- 項目2
- 項目3
強制改ページ
強制的に改ページを入れる場合は、次のように記述してください。
<br style="page-break-after: always;" />