分散インデックス型 全文検索ソフト 「Pokuda Search Pro」 ヘルプサイト
はじめに
「Pokuda Search Pro」はシェアウェアです。
初回起動から30日間は試用期間となっております。
30日を超えてご利用される場合は、以下よりライセンスキーをご購入ください。
ダウンロード/ライセンス購入方法
以下のページより、ダウンロード/ライセンス購入が可能です。
機能概要
HTMLなどのテキストファイル、Microsoft Office、PDFなどのドキュメントファイル、MP3、MP4などのメディアファイルのメタデータを
対象に全文検索するソフトです。
類似文書の検索も行うことができ、貯まったファイルを整理しなくとも目的のファイルに素早くアクセスできます。
また、外部インデックス参照機能により、サーバー上のファイルをインデックス化して共有することもでき、クライアントサーバ型ソフトとして、
複数ユーザで同じインデックスを検索することもできます。
v1.3.1.0よりIFilterでのインデックス化にも対応しました。
IFilterを使うことにより、縦書きPDFもインデックス対象にすることができます。
Adobe PDF iFilterの入手先はこちら
サーバ上のインデックスも参照して、社内の共有ドキュメントが全文検索可能に!!
「Pokuda Search Pro」は、ネットワークドライブ上のファイルも検索対象に設定することができます。
但し、ネットワーク経由なのでインデックス作成に時間がかかってしまいます。また、下図のように複数ユーザでファイルサーバー上のファイルを個々でインデックス化すると
グループ単位でPCのリソースを考えると、インデックス作成のCPU時間、ディスク容量共にも倍かかることになってしまいます。そこで、外部インデックス機能の出番です。
ファイルサーバー(WindowsOSである必要がありますが)上でインデックスを作成し、
クライアントPCは、その外部インデックスを参照して、検索を実行します。
これにより、グループ単位でのPCリソース節約を実現できます。社内の共有フォルダをインデックス化することにより、ドキュメントを探す時間が大幅に短縮できます。
機能一覧(無償版との比較)
機能 説明 有償版 無償版 全文検索 Luceneによる全文検索を行います。 ○ ○ テキスト抽出(Apache Tika) Apache Tikaを使ったテキスト抽出を行います。抽出可能ファイル一覧はこちら ○ ○ テキスト抽出(IFilter) IFilterを使ったテキスト抽出を行います。縦書きPDFもインデックス化可能になります。なお、抽出可能ファイルは、インストールしているIFilterに依存します。 ○ - インデックス作成 日本語形態素解析エンジンkuromojiを使って、文章を単語に分割し、転置インデックスを作成します。 ○ ○ プレビュー機能 選択したドキュメントの内容をプレビュー表示します。 ○ ○ もしかして検索 入力された検索キーワードに近い別の検索キーワードを提案します。 ○ ○ 類似文書の検索 インデックス内の類似文書を検索します。類似度はBM25で計測します。(BM25についの解説はこちら) ○ ○ 文書の差分表示 WinMergeを差分ツールに指定することにより、選択した2つのドキュメントを差分表示できます。 ○ ○ 外部インデックス参照 サーバー上に作成したインデックスを共有して複数ユーザーで1つのインデックスを検索することができます。 ○ - ファイラ機能(Ver.1.2以降) 2画面ファイラ。表示しているフォルダ以下を全文検索することもできます。 ○ -
リリースノート
2021/02/19 v1.3.1.0リリース
- Adobe PDF IFilter 11にも対応するように修正。
2021/02/14 v1.3.0.0リリース
- IFilterでインデックス作成できる機能を追加。(縦書きPDFもインデックス化できます。)
2021/01/19 v1.2.0.4リリース
- サブエクスプローラーのパスコンボボックスにおいて、履歴が重複して表示される問題を修正。
2020/12/27 v1.2.0.3リリース
- ファイラ画面でファイルを削除した後に、他のコントロールにフォーカスが移らないように修正。
2020/12/14 v1.2.0.2リリース
- ファイラ画面でパス入力しEnterキーを押下した時に例外が発生する不具合を修正。
- 2020/11/25 v1.2.0.1リリース
- 内臓エクスプローラの表示パスとWindows標準エクスプローラの初期表示パスがずれる場合がある問題を修正した
2020/11/09 v1.2.0.0リリース
- 2画面ファイラ機能を追加
- 検索条件にパスを追加
- 拡張子「xlsb」,「xlsm」,「pptm」のプレビュー表示を可能にした
- 拡張子「mp4」,「wmv」,「avi」,「mov」,「mkv」のプレビュー表示を可能にした
2020/07/16 v1.1.0.0リリース
- 日時指定検索の不具合を修正。
- 「もしかして検索」機能を追加。
- 「類似文書検索」機能の最大表示件数を変更できるように修正。
- 検索キーワードの分かち書き結果を表示する機能を追加。
2020/06/24 v1.0.0.0リリース
インストール
1.ダウンロードした自己解凍ファイルを任意の場所に解凍して下さい。(インデックスフォルダも作成しますので、空き容量のあるドライブに解凍して下さい。)
2.「インストール実行.vbs」を実行して下さい。以下の処理が行われます。
2-1.カレントフォルダにショートカットを作成。
2-2.Visual Studio 2015 の Visual C++ 再頒布可能パッケージがインストールされていない場合は、当該インストーラーを起動。
3.同じフォルダにショートカットが作成されているので、そこから起動して下さい。
※動作OS:Windows 10/8.1 (32/64bit)
アンインストール
1.配置したフォルダを削除するだけです。
※「Visual Studio 2015 の Visual C++ 再頒布可能パッケージ」もアンインストールする場合は、 「コントロールパネル」-「プログラムと機能」よりアンインストールして下さい。
マニュアル
インデックス作成
1.メインメニューの「インデックス作成」ボタンをクリックして下さい。
2.「参照」ボタンをクリックしてインデックス対象フォルダをしてくして下さい。
3.「インデックス作成」ボタンをクリックして下さい。
4.「中断」ボタンをクリックすればインデックス作成処理を取り止めます。
ファイル検索
1.「キーワード」を入力して下さい。
2.「検索対象インデックス」にチェックを入れて下さい。
3.「検索」ボタンをクリックして下さい。
4.検索結果で以下のようなリンク切れのアイコンが表示される場合があります。
このファイルは、インデックス作成時には存在したが、検索時点では削除されてしまい、開くことができないことを意味しています。
インデックスを更新して最新化することで解消することができます。
※詳細な検索条件の仕様はこちらを参照して下さい。
グリッド内フィルタ
「検索」ボタンは、インデックスに対して検索を実行しますが、
グリッド内フィルタは、一度、検索した結果に対して更なる絞り込みを行います。
下記の場合、"overview"に部分一致する行だけ表示します。
プレビュー表示
1.検索結果の行を選択して下さい。
2.テキストプレビューパネルには、マッチしたキーワードと前後の文章が表示されます。
3.ページプレビューパネルには、そのドキュメントの外観が表示されます。
4.また、検索結果の行をダブルクリックすることにより、対象のファイルを開くことができます。
Windows標準プレビューの有効化
1.Microsoft Officeのページプレビューを表示させるには、ドキュメント保存時に「縮小版を保存する」にチェックを入れておく必要があります。
類似文書の検索
1.検索結果の行を選択して下さい。
2.右クリック「類似文書を検索」をクリックして下さい。
文書の差分表示
1.比較する検索結果の行を選択して下さい。
2.右クリック「差分」をクリックして下さい。
3.WinMergeで「差分」表示されます。(※予めWinMergeをインストールし、そのパスを設定画面で指定しておく必要があります。)
外部インデックス追加
1.「インデックス管理」ボタンをクリックして下さい。
1.「参照」ボタンをクリックして下さい。
2.ネットワークドライブ上の「<Pokuda Search Proインストールフォルダ>\bin\DB」フォルダを指定して下さい。
3.「OK」ボタンをクリックして下さい。
1.フォルダの指定が完了したら、「外部インデックス追加」ボタンをクリックして下さい。
1.利用できる外部インデックスの一覧が表示されますので、参照したいインデックスを選択して下さい。
2.選択したインデックスに対応する、ローカルパスを入力して下さい。
3.「OK」ボタンをクリックして下さい。
1.外部参照インデックスが追加されているのを確認して下さい。
2.ダイアログを閉じて下さい。
1.追加した「外部参照」インデックスをONにすれば、サーバー上のインデックスを検索できます。
(サーバー上でインデックス更新中でも、クライアント側から検索を実行することができます。)
ファイル検索画面のショートカット一覧
キー | 概要 |
Ctrl+E | エクスプローラー画面に移動します。 |
Ctrl+K | キーワードテキストボックスにジャンプします。 |
Ctrl+P | 標準プレビューパネルの表示・非表示を切り替えます。 |
Ctrl+Shift+P | 拡張プレビューパネルの表示・非表示を切り替えます。 |
ライセンス認証方法
1.「ライセンス認証」ボタンをクリックして下さい。
2.購入頂いたライセンスキーを入力して下さい。
3.「送信」ボタンをクリックして下さい。ライセンスが認証されれば、試用期間の制限が解除されます。
設定
1.「検索結果最大件数」:検索結果の最大表示件数です。
2.「類似検索結果最大件数」:類似検索の最大表示件数です。
3.「差分ツール」:差分ツールの実行ファイルへのパスです。WinMergeでは動作することを検証しております。
4.「最大ファイルサイズ」:インデックス対象ファイルのサイズの上限です。これを超えるファイルのインデックスは作成されません。(※MP4ファイルは対象外)
5.「メモリ使用量」:インデックス作成時の最大利用メモリ量です。インデックス作成が遅い場合は、この数値を上げると効果がある場合があります。
6.「ローカルインデックス」:自PCで作成したインデックスを指します。ONにするとローカルインデックスが検索対象としてデフォルトでONになります。
7.「外部インデックス」:他PCで作成したインデックスを指します。ONにすると外部インデックスが検索対象としてデフォルトでONになります。
8.「もしかしてキーワードを表示」:入力された検索キーワードから、ヒットする近いキーワードを提示します。(※検索時間が長くなるためデフォルトではOFFにしています。)
テキスト抽出可能ファイル一覧
カテゴリ | 拡張子 | 備考 |
HTML | .html | HTML |
.htm | HTML | |
.xhtml | Extensible HyperText Markup Language | |
XML | .xml | XML |
Microsoft Office | .ppt | PowerPoint97 - 2003 |
.pptx | PowerPoint | |
.pptm | マクロ有効PowerPoint | |
.xls | Excel 97 - 2003 | |
.xlsx | Excelブック | |
.xlsm | マクロ有効Excelブック | |
.xlsb | Excelバイナリブック | |
.doc | Word97 - 2003 | |
.docx | Wordドキュメント | |
Open Document Format | .odt | ワープロ |
.ods | 表計算 | |
.odp | プレゼンテーション | |
.odb | データベース | |
.odg | 図形 | |
.odf | 数式 | |
iWorks Documet | .pages | ワープロ |
.numbers | 表計算 | |
.key | プレゼンテーション | |
リッチテキストファイル | .rtf | Rich Text Format |
Portable Document Format | ||
電子書籍 | .epub | Electronic Publication Format |
圧縮ファイル | .tar | |
.rar | ||
.zip | ||
.7z | ||
.gzip | ||
テキストファイル | .txt | Textファイル |
.bat | Windowsバッチファイル | |
.log | Logファイル | |
.csv | CSVファイル | |
.sql | SQL | |
.js | JavaScript | |
.cs | C# | |
.md | Markdown | |
.mdown | Markdown | |
.cpp | C++ソースファイル | |
.java | Javaソースファイル | |
Helpファイル | .chm | Microsoft Compiled HTML Help |
Audioファイル | .mp3 | |
Imageファイル | .jpg | |
Videoファイル | .mp4 | |
Java class files and archives | .class | |
.jar | ||
メール | .pst | Microsoft Outlook PST email |
CADファイル | .dwg | DWG |
Fontファイル | .ttf | TrueType font |
Databaseファイル | .db | SQLite3 files |
インデックス作成時間/サイズ【参考値】
- CPU:Intel Corei7-5500U 2.4GHz
- メモリ:8GB
対象ファイル数 | 新規作成時間 | 更新時間(3%変更) | インデックスサイズ |
---|---|---|---|
300 | 約1分 | 約10秒 | 60MB |
3,000 | 約10分 | 約2分 | 500MB |
3万 | 約2時間 | 約30分 | 6GB |
30万 | 約5時間 | 約90分 | 16GB |
ファイラ機能(Ver.1.2以降)
1.ファイルエクスプローラー画面を表示します。
2.メインのファイルエクスプローラー(MainExplorer)です。
3.サブのファイルエクスプローラー(SubExplorer)です。
3.1つ前のパス履歴に戻ります。
4.1つ先のパス履歴に進みます。
5.1つ上のパスに移動します。
6.現在のパスをWindows標準のエクスプローラーで開きます。
7.パス履歴のコンボボックスです。
8.最新表示します。
9.ファイル検索画面に移動し、現在のフォルダ以下を全文検索します。
※インデックスの作成状況によって、以下のアイコン背景色で表示されます。 インデックス未作成の場合は、インデックス作成メッセージが表示されます。
エクスプローラー画面のショートカット一覧
キー | 概要 |
Alt+D | アドレスバーコンボボックスへ移動 |
Alt+Left | 1つ前のパス履歴に戻る |
Alt+Right | 1つ先のパス履歴に進む |
Backspace | 1つ前のパス履歴に戻る |
Alt+Up | 1つ上のパスに移動。 |
Ctrl+F | ファイル検索画面へ(カレントパスで) |
Ctrl+S | ファイル検索画面へ |
Ctrl+E | 現在のパスをWindows標準のエクスプローラーで開く |
ライセンス
PokudaSearchには、以下のライセンス規約が適用されるソフトウェアが含まれています。
Pokuda Search Proを試用しています。縦書きPDFを検索するために、IFilterを使ってインデックス作成をしたいのですが、テキストコンバータのラジオボックスで、「IFilter」を選択することができません。IFilterを使うにはどのようにしたら良いでしょうか。
返信削除ご試用頂き誠にありがとうございます。 現バージョン(v1.2.0)においては、IFilterのテキスト抽出に対応できておらず、選択できないようにしております。 (Apatch Tikaだけの対応となっております。) 次バージョンv1.3.0(2月頃リリース予定)では、IFilterも選択できるようにする予定ですので、次バージョンのリリースをお待ち頂ければ幸いです。
削除ご返信ありがとうございます。テキスト抽出の仕様について、承知しました。よろしくお願いいたします。
削除IFilterのご対応、ありがとうございます。早速試させていただきました。
削除縦書き検索が使えるようになったので大変助かります。
また、64bitのIFilterを使用したインデックス作成は32bitのAcrobat IFilter 6.0と比べてとても速く、ありがたいです。
現時点で、いくつかバグを発見したのでここに報告させていただきます。
・初回起動から、「ファイル検索」機能を一度も使わない状態で「設定」を開いて「適用」ボタンを押すと例外が発生する。
*アプリケーションを再起動しても同じ。
*設定の内容を変えても変えなくても発生する。
*インデックスが全く作成されていなくても、一度ファイル検索の「キーワード」欄に何かを入れて検索を実行すれば例外は発生しない。
・WinMergeUがインストールされていない環境で「設定」を開いて「適用」ボタンを押すと例外が発生する。
・ファイル検索画面のプレビュー欄に残像が発生することがある。
*エクスプローラ、インデックス管理の画面から遷移したときにプレビューの位置だけ内容が変わらない。
*アプリケーションを起動して、1度目にファイル検索画面に切り替えたとき、発生しやすい。
環境:
Lenovo ThinkStation P330 Tower
CPU: Core i5-9500, メモリ: 36GB (DDR4-2666), GPU: GeForce GTX 1660 Super,
システムドライブ: SSD 500GB (Crucial MX200) OS: Windows 10 Pro (20H2)
不具合の報告、ありがとうございます。
削除速やかに調査し、修正版をリリースさせて頂きます。
●v1.3.1.0で以下の2つの不具合を修正しました。
削除①初回起動から、「ファイル検索」機能を一度も使わない状態で「設定」を開いて「適用」ボタンを押すと例外が発生する。
②WinMergeUがインストールされていない環境で「設定」を開いて「適用」ボタンを押すと例外が発生する。
→WinMergeUをインストールしていない場合は、パスをブランクで設定して下さい。
※以下については、当方の環境で再現できておりません。
環境に依存するものかと推測しておりますので、他のPCで引き続き調査いたします。
・ファイル検索画面のプレビュー欄に残像が発生することがある。
このコメントは投稿者によって削除されました。
返信削除NASにある20個以上のフォルダをネットワークドライブを割り当てで
返信削除一つずつインデックス作成していますが
一気に全ドライブのインデックス作成できないでしょうか?
現バージョンでは、一括でインデックスを作成できません。
削除次バージョン以降で実現したいと考えています。
また、コマンドラインでのインデックス作成を可能にして、
バッチファイルによる夜間インデックス更新ができることも考えています。