#author("2021-06-18T12:15:50+00:00","default:hotate","hotate")
#author("2023-06-02T11:36:46+00:00","default:hotate","hotate")
#contents
&tag(PDF, Office, テキスト);
&tag(PDF,Office,テキスト);

* 情報 [#l7e43950]
- [[xdoc2txt>http://ebstudio.info/home/xdoc2txt.html]]
 xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から、テキスト要素を抽出 する汎用テキストコンバータであり、Windowsのコマンドラインで動作します。
-- 関連:[[Excel]], [[Word]], [[PDF]]
- [[サーバ上でPDFやオフィス文書からテキストを抜き出す方法あれこれ - ククログ(2010-08-02)>http://www.clear-code.com/blog/2010/8/2.html]]
 Windowsでテキストを抽出するソフトウェアとしてはxdoc2txtなどがありますが、ここでは、Linuxサーバ上でテキストを抽出する方法を紹介します。

* 関連 [#u1449492]
#related

#taglist(tag=Office)
#taglist(tag=PDF)

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS