以下のSampleのとおり、TextExtractor.Extract()メソッドで、ファイル内の文字列を取得できます。
※Shift-Jisのテキストファイル(.txt)は、UTF-8に変換しないと抽出に失敗するので要注意。
- public void TikaExtractorTest() {
- var txtExtractor = new TextExtractor();
- var path = @"C:\Temp\Test.xlsx";
- var content = txtExtractor.Extract(path);
- Debug.WriteLine(content.Text);
- }