Warning: リポジトリと同期できません (サポートされていないバージョンコントロールシステム "svn です。 Python のライブラリに "svn" が正しくインストールされているか確認してください。)

リポジトリの全文検索 with HyperEstraier プラグイン Ver 0.1

1. 概要

この間作ったリポジトリ検索プラグインのHyperEstraier版を作りました。
こっちはCGI版でもmod_python版でも動きます。

仕組み:バッチでリポジトリをエクスポートし、HyperEstraierのインデックスを生成します。Trac内でコマンド版cmdestを実行し、その結果を表示します。

cmdestの出力をXMLにしたせいでかえって文字コードがややこしかった。動作確認はWindowsのみで行ってます。
HyperEstraierのpythonバインディングは使いませんでした。Windowsでのビルドに挫折。

確認済み環境

Trac0.9, Trac.011

制限

  • リポジトリ内の最新のファイルしか検索できません。
  • Windowsでしか動作確認してません。でもUnix系でも動くかも。
  • apacheからcmdest.exeを起動できるように権限設定が必要かもしれません。
  • もちろん動作は無保証です。コメントに何か書いてくれれば反応はするかもしれません。

3. セットアップ

3.1 ダウンロード

Subversion を使用して、CodeReposからHTTP経由でチェックアウトしてください。コマンドラインクライアントでは、以下のようにします。

svn checkout http://svn.coderepos.org/share/platform/trac/plugins/searchhyperestraier


3.2 インストール

プラグインのインストールを行います。(Tracのプラグインに共通する説明は、[wiki:TracPlugins TracPlugins]を参照してください。)

(1) eggの設置

zipを解凍してください。
解凍して出来たフォルダ配下のtrunkディレクトリ(trac0.9用は/branches/0.9)に移動してください。
以下のコマンドを実行して下さい:

$ python setup.py bdist_egg

distフォルダが作成されます。
その中にある*.eggファイルを、TracEnvのplugins ディレクトリにコピーしてください。

3.3 HyperEstraierをセットアップする

HyperEstraierをインストールして動くようにしてください。以下の手順で私はできました。できないひとは自分で調べてね。

(1) HyperEstraierをインストール

http://hyperestraier.sourceforge.net/ よりダウンロード(Windowsなら「 Windows版のバイナリパッケージ 」)。
Unix系ならビルドするのかな。Windowsでは適当なフォルダ(C:\hyperestraier等)に解凍。

(2) 環境変数PATHの設定

環境変数PATHに、(1)で置いたフォルダを追加。

3.4.インデックスの設定をする

リポジトリのエクスポートとインデックス生成を行うバッチを作成します。 makeindex.batを適切に書き換えてください。冒頭部の環境変数を書き換えてください。このバッチでやっているのは、(1)リポジトリのエクス ポート(2)インデックス生成です。Unix系の人は自分でがんばって。
なお、リポジトリのエクスポートの認証は考慮してません。認証が必要であればsvn exportに適切な引数を設定してください。

makeindex.bat

set EXPORT_FOLDER=E:\RepositorySearch\rep
set REPOS_URI=file:///e:/SVNrepo/MyRepository/trunk/test3
set INDEX_FOLDER=E:\RepositorySearch\casket

rmdir /S /Q %EXPORT_FOLDER%
svn export %REPOS_URI% %EXPORT_FOLDER%
rmdir /S /Q %INDEX_FOLDER%
estcmd gather -cl -fx .pdf,.rtf,.doc,.xls,.ppt T@estxfilt -ic CP932  -pc CP932 -sd %INDEX_FOLDER% %EXPORT_FOLDER%

EXPORT_FOLDERリポジトリのエクスポート先となるフォルダ。空のフォルダを指定。
REPOS_URIエクスポート元となるリポジトリのURI
INDEX_FOLDERインデックスの生成先フォルダ。空のフォルダを指定。

makeindex.batを実行した後で、以下のコマンドを実行して、正しく検索されることを確認してください。

 estcmd search -vx -sf -ic Shift_JIS [index_path] [query] >hoge.xml

[query]には適当に結果が出るキーワード(注:半角アルファベットで)、[index_path]にはmakeindex.batで指定した INDEX_FOLDERを指定してください。 結果はhoge.xmlファイルに出力されます。テキストエディタで開いて文字コードがUTF-8で出力されていることを確認してください。

動作確認ができたらmakeindex.batが1日1回実行できるようにWindowsのタスクを設定してください。

3.5 trac.iniを設定する

テキストファイルでtrac.ini(リポジトリのフォルダのconf配下)を開いて searchhyperestraierというブロックを追加してください。

index_pathインデックス生成パス(makeindex.batのINDEX_FOLDER)
replace_left検索結果のパスの頭で削るべき文字列。
browse_tracTracのブラウザへのリンクを作るか否か。enabled=Tracのブラウザへのリンクを作る。デフォルトは'enabled'。
url_leftURLを生成する際に頭につける文字列。browse_trac=enabledの場合は/がリポジトリのルートになるようにすること。
estcmd_path環境変数PATHが設定済みなら設定不要。estcmd.exeの絶対パス。デフォルトは'estcmd'
estcmd_argWindowsでは設定不要。estcmd.exeの引数。デフォルトは'search -vx -sf -ic Shift_JIS'
estcmd_encodeWindowsでは設定不要。コマンド実行時のエンコード(Pythonでの形式)。デフォルトは'mbcs'

例:

[searchhyperestraier]
index_path = E:\RepositorySearch\casket
replace_left = E:\RepositorySearch\rep
url_left = /trunk/test3

browser_tracがenabledになる場合は、登録されるURLはTracのリポジトリブラウザでRoot直下が/となるように replace_left,url_leftを調整する必要があります。
たとえば、リポジトリブラウザでRoot/trunk/test3/検索のテスト.docと表示されるファイルは、/trunk/test3/検索のテスト.docとなるように調整してください。
難しければ、何も設定せずに、検索結果として表示されたURLを見ながら調整してください。

3.6 Apacheを再起動する

なお、WindowsでApacheを使用している場合、Apacheの再起動をしてもPATHを読み直してはくれません。PC自体を再起動してください。

4. 検索してみる。

検索タブをクリックして、「リポジトリ」チェックボックスが表示されることを確認してください。
適当なキーワードで検索して、結果(source:××)が表示されることを確認してください。
リンクをクリックして、画面がリポジトリブラウザに切り替わり、正しくそのファイルを表示していることを確認してください。

5. ご意見・ご要望

ご意見・ご要望はこちら から登録してください。
これまでに登録されたものはこちら を参照してください。


(None)

添付ファイル