はじめに

はじめに — テキスト抽出ユーティリティChupaTextの概要

名前

ChupaText

ソースコード: LGPLバージョン2.1またはそれ以降のバージョン（詳細: license/lgpl-2.1.txt ）です。
ドキュメント: LGPLとGFDLとクリエイティブ・コモンズ・ライセンスのトリプルライセンス。
- LGPLバージョン2.1またはそれ以降のバージョン（詳細: license/lgpl-2.1.txt ）です。
- GFDLはバージョン1.3またはそれ以降のバージョン（詳細: license/gfdl-1.3.txt ）です。
- クリエイティブ・コモンズ・ライセンスは表示-継承（CC BY-SA）です。
例外:
- modules/excel/: GPLバージョン2（詳細: license/gpl-2.txt ）です。 Gnumeric に含まれているファイルです。
- ...

ChupaTextはPDFやオフィス文書からテキストとメタデータを抽出するユーティリティです。ライブラリ、コマンドライン、Webサービス経由で利用できます。

必須:

任意:

ChupaTextのリポジトリは GitHub 上にあります。

% git clone git://github.com/ranguba/chupatext.git

インストールを見てください。

% chupatext [オプション ...] ファイル ...

ファイルにテキストを抽出したいファイルを指定します。

詳細は chupatext を見てください。