以下のSampleのとおり、TextExtractor.Extract()メソッドで、ファイル内の文字列を取得できます。
※Shift-Jisのテキストファイル(.txt)は、UTF-8に変換しないと抽出に失敗するので要注意。
public void TikaExtractorTest() {
var txtExtractor = new TextExtractor();
var path = @"C:\Temp\Test.xlsx";
var content = txtExtractor.Extract(path);
Debug.WriteLine(content.Text);
}
0 件のコメント:
コメントを投稿