本文へジャンプ

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 ご使用条件を読む


お客様が developerWorks に初めてサインインすると、プロフィールが作成されます。プロフィールで選択した情報は公開されますが、いつでもその情報を編集できます。お客様の姓名(非表示設定にしていない限り)とディスプレイ・ネームは、投稿するコンテンツと一緒に表示されます。

送信されたすべての情報は安全です。

  • 閉じる [x]

developerWorks に初めてサインインするとプロフィールが作成されますので、その際にディスプレイ・ネームを選択する必要があります。ディスプレイ・ネームは、お客様が developerWorks に投稿するコンテンツと一緒に表示されます。

ディスプレイ・ネームは、3文字から31文字の範囲で指定し、かつ developerWorks コミュニティーでユニークである必要があります。また、プライバシー上の理由でお客様の電子メール・アドレスは使用しないでください。

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 ご使用条件を読む


送信されたすべての情報は安全です。

  • 閉じる [x]

Calibre を使用して電子出版物を管理し、変換する

文書を使いやすくする

William von Hagen, Systems Administrator, Writer, WordSmiths
William von Hagen は、20 年以上の執筆活動および UNIX システム管理者としての経歴を積んでいます。1993年以来 Linux の支持者である彼は著者または共著者として、Ubuntu Linux、Xen 仮想化、GCC (GNU Compiler Collection)、SUSE Linux、Mac OS X、Linux ファイルシステム、 SGML などについての本を書いています。また、Linux および Mac OS X の出版物や Web サイトにも多数の記事を載せています。

概要: 現在、製品に関するドキュメントや資料の大部分は PDF フォーマットで配布されており、また多くの書籍がさまざまな電子出版フォーマットで提供されています。スマートフォン、ポータブル PC、タブレット PC にはすべて、これらの文書を読むためのアプリケーションが用意されています。Kindle、Nook、Kobo eReader などの、専用の電子書籍リーダーもあります。残念なことに、これらの電子書籍リーダーがサポートする電子出版フォーマットはそれぞれ異なり、これらの電子出版物を多様な機器で利用する上で妨げとなっています。この記事では、これらのフォーマット間で書籍や文書を変換することができるオープンソースのアプリケーション、Calibre を紹介します。

日付:  2011年 11月 25日
レベル: 中級 この記事の原文:  英語
アクティビティー: 2724 ビュー
お気軽にご意見・ご感想をお寄せください: 


地球にやさしく、便利な電子出版

今日のモバイル・ワーカーや常時接続の社会では、常に情報にアクセスできることが基本的な前提となっています。Web ベースのコンテンツは本質的に、ネットワーク機能とブラウザーを備えたあらゆるモバイル機器で利用することができます。しかし分量のあるコンテンツは、さまざまな電子出版フォーマットを利用してモバイル機器やポータブル機器にローカル保存した方が便利です。

タブレット PC、スマートフォン、電子書籍リーダーなどの機器が普及したことから、製品の資料やドキュメントを、社内向けにも顧客向けにも、電子出版フォーマットで提供する組織が増えています。電子的に文書を提供することで、より早く利用者や顧客のもとに文書を届けられるようになり、費用の節約や紙の節約につながると同時に、文書の更新も簡単になります。また、顧客は場所を問わず簡単に出版物を入手することができ、どのような形で利用するかも決めることができるため、電子出版物には利用する側にも出版する側にも直接的なメリットがあります。


ポータブル機器用出版物の問題点

電子出版により、文書の配布と利用に関する多くの問題を解決することができます。しかし新たな問題として、どのフォーマットで電子コンテンツを提供するのかという問題が発生します。表 1 は最も一般的な電子出版フォーマットと、それらのフォーマットをサポートする機器を一覧にしたものです (ただし、他にも数多くのフォーマットが積極的に使用されています)。この表を見るとわかるように、どの電子書籍リーダーも (それがアプリケーションであれ、専用機器であれ)、これらのフォーマットの一部しかサポートしていません。従って企業が電子コンテンツを作成して出版する場合、適切な電子出版フォーマットを選択する必要があります。つまり、少なくとも企業および顧客が使用している機器やアプリケーションでサポートされているフォーマットを選択する必要があります。


表 1. 電子出版フォーマットと、サポートされている機器
フォーマット説明電子書籍リーダーによるサポート
TXTプレーン・テキスト・フォーマットすべての機器
HTMLHypertext Markup Languageほとんどの機器
例外: Barnes & Noble の Nook
PDFAdobe® Portable Document Format
文書を作成する際にテキストのリフローを有効にしていない限り、モバイル機器で使いやすいとは言えません。
ほとんどの機器
EPUB電子出版用として幅広くサポートされています。
詳細は「参考文献」を参照
ほとんどの機器
例外: Amazon の Kindle
MOBIOEB (Open eBook) フォーマットの仕様に従っています。
PRC (Palm) や AZW (Amazon DRM 対応の MOBI) 拡張機能がある場合もあります。
ほとんどの機器
例外: Nook
LITMicrosoft が開発した電子書籍フォーマットMicrosoft Reader アプリケーションのみ
PDBこの拡張子のファイルはさまざまな機器でのさまざまなフォーマットを指します。Sony Reader、オープンソースの Plucker アプリケーション、Palm と Palm 互換機器の TealDoc 文書

無料のオープンソース・アプリケーションである Calibre を利用すると、これらのさまざまなフォーマットを手軽に変換することができます。Calibre は電子出版物のフォーマットを変換することができ、電子文書を特定のフォーマットや機器の制約から解放することができます。Calibre は一般的な電子出版フォーマットをすべて読み取ることができ、PDF、テキスト、HTML フォーマットの文書をインポートすることができます。そして Calibre の変換機能を利用することにより、インポートされた文書を必要に応じて特定のフォーマットで保存することができます。

企業が自社の所有物ではない電子出版物を社内で使用するためにフォーマット変換する場合、それらの出版物の追加コピーを購入する必要があるかもしれない、ということを頭に入れておく必要があります。これに関して疑問がある場合は、それらの電子出版物のフォーマットを変換して再配布する前に、組織の法務担当者に相談してください。一方で、個人的な用途で電子出版物のフォーマット変換を行うことは、出版物に組み込まれた DRM 機構を削除せずに、出版元によって課せられた再配布の制限に従う限り、一般に許容される行為であるとみなされています。


Calibre を入手してインストールする

Windows や Apple Mac OS X にインストール可能な Calibre は、Calibre のダウンロード・ページ (「参考文献」を参照) から入手することができます。Linux 用の Calibre は、ほとんどの Linux ディストリビューションのリポジトリーにパッケージとして提供されており、ディストリビューションのパッケージ管理ユーティリティー (通常は apt-getrpmSynapticyum) を使用してインストールすることができます。ご使用のディストリビューションのリポジトリーに、パッケージ済みの Calibre がない場合、あるいは Linux ディストリビューション用として利用できるものよりも新しいバージョンの Calibre をインストールしたい場合には、以下のコマンドを使用してインターネットから最新バージョンの Calibre をダウンロードして、インストールすることができます。

python -c "import urllib2; \
  exec urllib2.urlopen('http://status.calibre-ebook.com/linux_installer').read(); main()"

このインストール・コマンドは、特権ユーザーとして実行する必要があります。そのためには su コマンドまたは sudo コマンドを使用し、バックスラッシュ (\) を入れずに 1 行でコマンドを入力します (この記事ではフォーマットの制約でバックスラッシュを入れています)。

このコマンドを入力すると、Linux 用の最新の Calibre パッケージがシステムにダウンロードされます。そして Calibre のインストール先となるディレクトリーの名前を入力するように促されます。

Enter the installation directory for calibre [/opt]:

ディレクトリーの名前を入力すると、インストーラーがそのディレクトリーの中に calibre サブディレクトリーを作成します。このサブディレクトリーには、Calibre と関連アプリケーション、データ・ファイル、ライブラリーが格納されます。また、単純に Return を押してデフォルト値 (/opt) を受け入れることもできます。その場合には /opt/calibre ディレクトリーが作成され、そこに Calibre がインストールされます。インターネットから Calibre をインストールすると、Calibre パッケージ内にある Calibre アプリケーションや他のアプリケーションを指すシンボリック・リンクがシステムの /usr/bin ディレクトリーに作成されます。

Calibre ライブラリーに文書をインポートする

Calibre は QT UIフレームワーク (「参考文献」を参照) を使用して標準的なクロスプラットフォームの GUI を提供するグラフィカル・アプリケーションです。Calibre をインストールするとコマンドライン・ツールもいくつかインストールされますが、それについては後ほど説明します。

Calibre をグラフィカル・モードで使用する場合、既存の文書に対して変換、注釈付け、あるいはその他の変更を行う前に、それらの文書を Calibre ライブラリーにインポートする必要があります。インポート対象の文書を選択するには、Calibre のツールバーで「Add books (本を追加)」アイコンをクリックします。表示されるナビゲーション・ウィンドウで対象の文書を見つけて選択し、「Open (開く)」をクリックしてインポートします。

Calibre のメイン・ウィンドウには、現在 Calibre ライブラリー内にある文書に関する要約情報が表示されます。初めて Calibre を起動したときには、この一覧には「Calibre Quick Start Guide (Calibre クイック・スタート・ガイド)」のみが含まれています。このガイドは Calibre の使い方を紹介し、基本機能を一通り説明するために含まれています。Calibre ライブラリーに複数の文書をインポートすると、この要約情報のリストにはインポートされた文書のエントリーも表示されるようになります (図 1)。


図 1. インポートされた文書を表示する Calibre のメイン・ウィンドウ
メイン・ウィンドウのスクリーン・ショットが示されています。最上部に機能ボタンが並び、その下の 3 列の領域には、カテゴリー・リスト、文書リスト、現在選択されている文書のプレビューがあります。


ライブラリー内にある任意の文書を選択すると、その文書のプレビューが右側のペインに表示されます。その文書に対して現在使用できる出力フォーマットがプレビュー画像の下に表示されます。

Calibre に文書をインポートすると、Calibre のツールバーの各アイコンをクリックすることで、文書に対してさまざまな処理 (文書フォーマットの変換、文書のメタデータ (書籍の書誌情報) の追加および変更など) を行うことができます。ツールバーの各アイコンと、それらに関連する処理の完全なリストについては、Calibre のマニュアルまたはオンライン・ヘルプを参照してください。

文書の電子フォーマットを変換する

Calibre のツールバー・アイコン「Convert books (本を変換)」をクリックすると、Calibre ライブラリー内の文書を他の電子フォーマットに容易に変換することができます。ライブラリー内の 1 つまたは複数の文書を選択し、このアイコンをクリックすると、Calibre の基本変換ウィンドウが表示されます (図 2)。


図 2. Calibre の基本変換ウィンドウ
基本変換ウィンドウのスクリーン・ショットが示されています。最上部で入力フォーマットと出力フォーマットを選択することができます。その下には 1 列のオプション・ウィンドウがあり、「Metadata (書誌情報)」が選択されています。このウィンドウの残り部分には書誌情報を構成する各種の項目が表示されています。


左上部にある「Input format (入力フォーマット)」リストにより、選択された出版物のフォーマットを特定することができ、右側にある「Output format (出力フォーマット)」リストにより、その出版物の変換後の電子出版フォーマットを選択することができます。左側のペインのボタンを使用すると、入力フォーマットと出力フォーマットに合わせて変換プロセスのさまざまな側面をカスタマイズすることができます。これらのさまざまな項目を設定することで、デフォルトの変換プロセスをカスタマイズすることができます。例えば、入力出版物の中で、変換後の文書の目次に記載する項目として扱う必要のある部分を特定する論理表現を指定する、といったことができます。

変換プロセスをカスタマイズした後、「OK」 をクリックすると、バックグラウンド処理として変換が開始され、Calibre のメイン・ウィンドウが再度表示されます。左下隅のステータス・インジケーターには何個目の変換処理が進行中であるかが表示されます。変換プロセスが完了すると、Calibre はフォーマットのリストを更新し、変換によって生成された新しい文書のフォーマットがリストに含まれるようになります。


Calibre を使用して書籍の書誌情報を追加または変更する

メタデータはよくデータに関するデータと呼ばれますが、書籍のメタデータである書誌情報は、書籍の本体そのものとは別の部分に関する情報です。書籍には通常、作成者、出版者、出版日などの書誌情報が含まれています。Calibre の「Edit metadata (書誌を編集)」コマンドを利用すると、選択された書籍に関連付けられた現在の書誌情報を容易に表示することができ、この機能を利用して書籍の書誌情報を追加、編集、削除することができます。ライブラリー内の 1 つの書籍を選択して「Edit metadata (書誌を編集)」アイコンをクリックすると、Calibre の「Edit Metadata (書誌情報を編集)」ウィンドウが表示されます (図 3)。


図 3. Calibre の「Edit Metadata (書誌情報を編集)」ウィンドウ
「Edit Metadata (書誌情報を編集)」ウィンドウのスクリーン・ショットが示されています。変更可能なすべての項目と、選択された書籍に関連付けられたフォーマットを管理するためのツールが表示されています。

新しい書誌情報を追加する場合、または既存のエントリーを編集する場合には、該当するフィールドを選択し、変更または追加を行います。「OK」をクリックすると、変更された書誌情報が書籍に保存されます。「Cancel (キャンセル)」をクリックすると、変更内容が破棄されます。


Calibre のコマンドライン・ユーティリティーを使用して電子出版を自動化する

Calibre をインストールすると、電子出版を処理するコマンドライン・ツールもインストールされます。そうしたツールとして、書籍のフォーマットを変換するための ebook-convert アプリケーションや、書籍の書誌情報を追加または変更するための ebook-meta アプリケーションがあります。Calibre のコマンドライン・ユーティリティーを使用すると、Calibre ライブラリーに書籍をインポートする必要がなく、また自動書籍作成/出版システムに、書籍の変換機能や自動書誌情報挿入機能を統合する場合に便利です。

Calibre のコマンドライン・ユーティリティーの機能は、GUI によって提供される機能と同じであり、コマンドラインのオプションとそのオプションに関連する引数により、特定の動作を有効にしたり無効にしたりすることができます。各コマンドライン・ユーティリティーには、そのコマンドに利用できるオプションの一覧を表示する -h オプションがあります。例えば、変換プロセスに利用できるオプションをすべて表示するためには、ebook-convert コマンドに、入力ファイル名と出力ファイル名を指定し (それぞれのフォーマットはファイル拡張子で指定します)、最後に -h オプションを指定して実行します。


電子文書の変換のためのヒントと他のツール

Calibre の変換プロセスのデフォルト設定は、そのままで十分使用できますが、自動フォーマット変換が完璧であることは稀です。通常、文書を他のフォーマットに変換する場合、利用可能な変換オプションを繰り返し実験できると便利です。そうした実験では通常、最初に変換を行い、変換された文書を表示して変換プロセスの問題点や改善が必要な部分を特定し、変換設定を変更した後に再度文書を変換します。

変換プロセスで改善が必要な部分というのは通常、目次の項目をどうするか、文書の関連部分へのリンクをどう作成するか、といった部分です。図 4 は、変換された文書を Calibre の電子書籍ビューアーに表示した様子を示しています。この機能により、変換された文書を電子書籍リーダーにコピーしなくても変換結果を調べることができます。


図 4. 変換された文書を Calibre の電子書籍ビューアーに表示する
電子書籍ビューアーのスクリーン・ショットとして「Technical Notes (技術資料)」の目次が表示されています。左側の 1 列に各種機能ボタンが表示されています。

変換プロセスを改善するための他の方法として、他のツールを使用して最初の変換を行い、Calibre で変換しやすい別のフォーマットにする、という方法があります。例えば、長い技術文書を変換する際、Calibre に組み込みの変換を利用してテキストから HTML に変換するよりも、Linux システムで poppler-utils パッケージの一部として提供されているオープンソースの pdftohtml ユーティリティーを利用し、PDF フォーマットの文書から HTML を抽出する方が良い結果が得られることがあります。外部ツールを利用して文書を手動で変換した後、その変換プロセスで生成された出力ファイルから Calibre を使用して電子文書を生成することができます。

他にも、文書を事前に変換するオープンソース・ツール、または Calibre で変換された文書を編集して仕上がりを良くするためのオープンソース・ツールがたくさんあります。例えば、図 5 に示す Sigil は EPUB フォーマットの文書のための WYSIWYG グラフィカル・エディターであり、変換後の文書の微調整を簡単に行うことができます (図 5 を拡大したものを見るにはここをクリックしてください)。


図 5. 変換後の EPUB 文書を Sigil で微調整する
XML エディター用の典型的なレイアウトを備えた EPUB 文書エディターのスクリーン・ショット


変換後の文書を編集すると、Calibre の変換機能によってもたらされる時間とコストの節約効果が減少すると思われるかもしれません。しかし変換後の文書を Sigil などのツールで操作すると、変換プロセスの改善方法を見つけることもできます。同様に、電子出版物を最初に作成したツールで特定の手法を使用することにより、変換プロセスを改善できることもよくあります。一例として、「参考文献」セクションには、Adobe InDesign で作成された電子文書の変換プロセスを改善する方法を解説したプレゼンテーションへのリンクを挙げてあります。こうしたヒントは EPUB 文書を生成、変換するための内部機能に焦点を絞っている場合が多いのですが、Calibre など他の変換ツールを使用する場合にも役立ちます。


まとめ

従来の方法で出版をしている人と同様、さまざまな組織が、電子フォーマットで文書を提供すると便利でコスト効果が高いことに気付き始めています。今日の電子出版技術では、電子書籍やその他の文書をさまざまなフォーマットで提供することができますが、それらのすべてを電子書籍リーダーやアプリケーションのすべてで利用できるわけではありません。

オープンソース・アプリケーションの Calibre を利用すると、書籍の電子出版フォーマットを容易に変換することができます。組織はあるフォーマットで文書を作成し、Calibre を利用してそれらの文書を迅速に他のフォーマットに変換することができます。そのため、社内ユーザーが使用する場合も顧客が使用する場合も、簡単にこれらの文書をさまざまな機器やアプリケーションで利用できるようになります。


参考文献

学ぶために

  • Calibre の Web サイトを訪れ、Calibre の最新バージョン、ビデオ・チュートリアル、デモ、その他 Calibre に関する最新情報を見てください。

  • Nokia の Qt UI フレームワークについて学んでください。

  • 企業用の文書を作成するために InDesign を使用している場合には、「Preparing your InDesign files for ePub export」と「Using InDesign to create eBooks」を見てください。InDesign 文書から EPUB フォーマットへのエクスポートや変換を単純化するためのヒントが解説されています。

  • International Digital Publishing Forum のサイトを訪れ、デジタル出版業界の既存の標準と今後の標準について調べてください。

  • developerWorks の Open source ゾーンには、オープンソース・ツールやオープンソース技術の使い方に関する情報が豊富に用意されています。

製品や技術を入手するために

  • Windows 版 Calibre のダウンロード・ページから Windows オペレーティング・システム用の Calibre インストーラーをダウンロードしてください。

  • Mac OS X 版のダウンロード・ページから Mac OS X 用の最新の Calibre インストーラーをダウンロードしてください。Mac OS X Tiger を実行する Apple PowerPC システムまたは Intel ベースの Apple システム用の Calibre の最新バージョンは、0.7.28 です。このバージョンは他のバージョンとは別に SourceForge の Calibre サイトから入手することができます。

  • LexCycle が無料で提供する Stanza アプリケーションを利用すると、Apple iPod Touch、iPhone、iPad プラットフォームで電子出版物を読むことができます。

  • poppler ユーティリティーの Web サイトと、PDF ファイルから単純にテキストを抽出できるpdftohtml ユーティリティーのパッケージについて調べてください。

  • Sigil は EPUB フォーマットの電子書籍のための無料でクロスプラットフォームの WYSIWYG エディターです。

議論するために

著者について

William von Hagen は、20 年以上の執筆活動および UNIX システム管理者としての経歴を積んでいます。1993年以来 Linux の支持者である彼は著者または共著者として、Ubuntu Linux、Xen 仮想化、GCC (GNU Compiler Collection)、SUSE Linux、Mac OS X、Linux ファイルシステム、 SGML などについての本を書いています。また、Linux および Mac OS X の出版物や Web サイトにも多数の記事を載せています。

不正使用の報告のヘルプ

不正使用の報告

ありがとうございます。 このエントリーは、モデレーターの注目フラグが設定されました。


不正使用の報告のヘルプ

不正使用の報告

不正使用の報告の送信に失敗しました。


developerWorks: サイン・イン


IBM ID が必要ですか?
IBM IDをお忘れですか?


パスワードをお忘れですか?
パスワードの変更

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 利用条件

 


お客様が developerWorks に初めてサインインすると、プロフィールが作成されます。 プロフィールで選択した情報は公開されますが、いつでもその情報を編集できます。 お客様の姓名(非表示設定にしていない限り)とディスプレイ・ネームは、投稿するコンテンツと一緒に表示されます。

表示名をお選びください

developerWorks に初めてサインインするとプロフィールが作成されますので、その際にディスプレイ・ネームを選択する必要があります。ディスプレイ・ネームは、お客様が developerWorks に投稿するコンテンツと一緒に表示されます。

ディスプレイ・ネームは、3文字から31文字の範囲で指定し、かつ developerWorks コミュニティーでユニークである必要があります。また、プライバシー上の理由でお客様の電子メール・アドレスは使用しないでください。

(半角英数字で3文字以上31文字以下にする必要があります)


「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 利用条件

 


この記事を評価する

コメント

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=Open source
ArticleID=775794
ArticleTitle=Calibre を使用して電子出版物を管理し、変換する
publish-date=11252011

タグ

Help
このタグで、My developerWorks のすべてのタイプのコンテンツを見つけるために検索フィールドを使用します。

スライダーバーを使用することで、より多く(少なく)タグを表示します。

人気のタグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するトップのタグを表示します。

マイ・タグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するお客様ご自身のタグを表示します。

このタグで、My developerWorks のすべてのタイプのコンテンツを見つけるために検索フィールドを使用します。人気のタグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するトップのタグを表示します。マイ・タグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するお客様ご自身のタグを表示します。