#author("2021-06-18T12:15:50+00:00","default:hotate","hotate") #author("2023-06-02T11:36:46+00:00","default:hotate","hotate") #contents &tag(PDF, Office, テキスト); &tag(PDF,Office,テキスト); * 情報 [#l7e43950] - [[xdoc2txt>http://ebstudio.info/home/xdoc2txt.html]] xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から、テキスト要素を抽出 する汎用テキストコンバータであり、Windowsのコマンドラインで動作します。 -- 関連:[[Excel]], [[Word]], [[PDF]] - [[サーバ上でPDFやオフィス文書からテキストを抜き出す方法あれこれ - ククログ(2010-08-02)>http://www.clear-code.com/blog/2010/8/2.html]] Windowsでテキストを抽出するソフトウェアとしてはxdoc2txtなどがありますが、ここでは、Linuxサーバ上でテキストを抽出する方法を紹介します。 * 関連 [#u1449492] #related #taglist(tag=Office) #taglist(tag=PDF)