Skip to content

kurema/aozora2htmlSharp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

aozora2htmlSharp

aozorahack/aozora2htmlのC#版です。

v1.0

移植元v3.0.0準拠の実装をv1.0系統にしています。 挙動だけでなくメソッド名やテストもほぼ同じです。

v2.0以降はその限りではありません。

実行

コマンドはaozora2htmlです。以下のように実行します。

$ aozora2html foo.txt foo.html

こうすると、青空文庫記法で書かれたfoo.txtfoo.htmlに変換します。

また、青空文庫サイトで配布している、中にテキストファイルが同梱されているzip形式のファイルも変換できます。

$ aozora2html foo.zip foo.html

第1引数にURLを指定すると、そのURLのファイルをダウンロードして変換します。

$ aozora2html http://example.jp/foo/bar.zip foo.html

第2引数を省略すると、ファイルではなく標準出力に変換結果を出力します。

$ aozora2html foo.txt

コマンドラインオプションとして--gaiji-dir--css-files--use-jisx0213--use-unicode--check-newlineがあります。

  • --gaiji-dirは外字画像のパスを指定します。
  • --css-filesはCSSファイルを,区切りで指定します。
  • --use-jisx0213はJIS X 0213の外字画像を使わず、数値実体参照として表示します。
  • --use-unicodeはUnicodeのコードポイントが指定されている外字を数値実体参照として表示します。
  • --check-newline falseは改行コードのチェックを省略します。

可能な限り数値実体参照を使って表示するには、以下のようにオプションを指定します。

$ aozora2html --use-jisx0213 --use-unicode foo.txt

関連

レポジトリ 概要
aozorahack/aozora2html Rubyで実装されたオリジナル。
kurema/AozoraGaijiChukiXml 青空文庫・外字注記辞書【第八版】のXML形式。
kurema/JISX0213Table 派生レポジトリ。本プロジェクト用JIS X 0213テーブルを別レポジトリに分離したもの。ただしライブラリの分割はしない。

License

MIT

CC0にすることも考えましたが、依存ライブラリの関係でどちらにせよ著作権表記の省略はできません。