2ちゃんねるスレッド全文検索・・・ThreadSearch
■ このスレッドは過去ログ倉庫に格納されています
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな 取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック! よく見たらどの2chブラウザでもいいっぽいのかこれは JaneNidaの検索部分を抜き出したようなソフトだ おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。
>>4
datファイルのあるフォルダならブラウザは何でもいいです。 >>5
あきらかに趣旨が違うから、ここでもいい気が。 これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。 “2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
http://namidame.2ch.net/test/read.cgi/news/1204783364/
ボロクソ言われてんぞ 誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな 言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。 Googleデスクトップでdatが検索できればいいんだけどなぁ >>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって 板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。 >>21
使えるかは知らんが
Jane Log Indexer
ttp://www.geocities.jp/hiko_bae/janelogindexer.html >>25
おおー、これはすばらしい!
ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。
思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。 レジストリか…さじ投げする。
すまない。NGしてくれい。 >>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。
日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。 >>25
へえ。こういうのあるんですね。
>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。 >32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。 NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。 そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。
この機能は凄いありがたいんでどうにか高速化して欲しい cenさんありがとう、これ物凄い便利です
要望ってここで書いちゃっていいのかな?
追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと
最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。
御一考頂ければなぁ、と思います >>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。 >>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね >>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ index作成型 期待
ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。
まあindex作成型なら板指定なんかする必要は無いとも思いますが。 index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。 >>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。
>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。 インデックスは独自?
それともnamazuとか使うの? おはようございます。
スレッド全文検索を更新しました。
Ver 1.50になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。 インデックスを使うことで高速に検索できるようになりました。
http://www.geocities.jp/cen_hp/threadsearch.html#7
HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。 それから、検索結果はVer1.00と同様の結果が出ます。 あと、方法は独自と書きましたがほぼngram法です。 Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに
「インデックス作成中・・・ファイルリスト作成中」
と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・ >>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。
一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt 〜 index_xx.txt(xxは数字)
・path.txt >>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。 >>50
キタ━━━━━━(゚∀゚)━━━━━━ !!!!
とても乙です!
うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)
検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です
>>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。 >>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。 >>55
あと、ウインドウ・サイズも覚えておいて欲しい。
.NET Framework ソフトとしては軽いので結構期待してる。 うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。
祭日中にとっても乙 >>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl. index作成開始2時間半後で45%
まだまだ先は長いな。 使って頂いてありがとうです。
>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。
>>59
それもいいかもしれないですね。
>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。 初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。
indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか? >>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。 乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。
もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です >67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-) >>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。 >>68
設定読み込みで、iniファイルを選べるからそれでしてみたら? どうもありがとうです
>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。
>>70
そういう方法もあるとは >>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます
>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。
>>73
窓の杜も細かく拾いますねw 俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか .NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが VCは.NETに比べて手間が10倍くらいに増えるからな。
起動速度だけのためにそんな手間はかけてられないって感じじゃね? 8.4ギガ程のログで3ギガ程のindexが出来ますた。 DesktopHE
ttp://freemind.s57.xrea.com/desktophe/index.html
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか >>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。
>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。
>>80
そういうのもあるんですか。
ちょっと見てみます。 + + ワクワクテカテカ
∧_∧ +
(0゜・∀・)
(0゜∪ ∪ + index追加型、急かしてないよ?
と__)__) + + + ワクワクテカテカ
∧_∧ +
(0゜・∀・)
(0゜∪ ∪ + 急かしてないよ、ホントだよ?
と__)__) + Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
ttp://www.oshiete-kun.net/archives/2008/05/janedat.html
Datファイル全文検索ソフト DatE
ttp://frozenlib.net/DatE/
こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ
Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ 「バージョンくる」の意味が分からなかったのでグッてみた
ver・sion
━━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.
たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ? >86
バージョンこないから試してみようとしたけど起動しないや・・・ 俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
∨
___ _
/ ____ヽ /  ̄  ̄ \
| | /, −、, -、l /、 ヽ きみ頭だいじょうぶ?
| _| -|○ | ○|| |・ |―-、 |
, ―-、 (6 _ー っ-´、} q -´ 二 ヽ |
| -⊂) \ ヽ_  ̄ ̄ノノ ノ_ ー | |
| ̄ ̄|/ (_ ∪ ̄ / 、 \ \. ̄` | /
ヽ ` ,.|  ̄ | | O===== |
`− ´ | | _| / |
【 南極堂...断罪アイアンメイデン 】 http://www42.atwiki.jp/ironmaiden/ どうもです。
ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。 みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?
これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。
indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。
あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。 >>98
どうもです。
このソフトでは保存してる全てのログから、検索語を漏らすこと無く
検索するので他のものより遅いのではと思います。
ソフトの性能かもしれないです。
みみずん検索の仕組みがどういうものか知りませんが・・・ >100
あ、そっか。
みみずん検索は検索板を指定しましたね。
長期使ってないから全板検索だと勘違いしてました orz >>98
一般的なWebサーチエンジンは単語単位の検索結果をあらかじめ作ってる。
新しく見つけたページに「2ch」「モナー」という単語があったときは、2ch.txtとモナー.txtにそのページのアドレスを追加する。
「2ch モナー」で検索されたときは2ch.txtとモナー.txt両方に載っているアドレス一覧を表示するといった感じ。
ただし、ここでいう「単語」とはあらかじめリスト化されたものと機械的に認識されたものなので
でたらめな文字列で検索した場合は表示されない可能性もある。 >102
なるほど。
そうしちゃうと今より高速化はしてもindexが肥大しそうですね。
今は8.5Gのログに対しindexが3.2Gです。 >>103
日本語対応の全文検索インデックスはでかいよー。
特に完全検索用のN-Gramインデックスは、たとえば「本日は晴天なり」って書いてあるテキストが
あったとすると
本日
日は
は晴
晴天
天な
なり
というそれぞれの文字列についてインデックスを作成する。
検索時には、たとえば「本日は」で検索されたら「本日」「日は」の両方にのっているファイルを
検索結果に表示する、という方式。
確実なんだけどでかい。 みみずん氏でこんなもんか。
ttp://mimizun.com/spec.html 「Windows Vista の検索において、語句が検索されない場合がある」
http://support.microsoft.com/kb/952003/ja
「アクセスコントロールリスト」 があるのに "コントロール"を検索できません。
これは仕様です。日本人はfindとかfindstrを使いなされ。
テキストのフィルタが駄目すぎだなあ
IMEの件といい、ほんとMSは日本語に弱くなったな そんなんだからMS社員がATOK使いたいとか言い出すんだ。 こんばんは
>>104
このソフトのインデックス方法もそういう方法使ってますね。
屑HDにログ移行したんだけど、残り容量少なくてINDEX作りきれなかった orz 今のところ、新しいindexの形式で、index作成と読み込みのテストが
できています。
更新部分を作る前に公開するかもしれません。
何時になるかは不明ですが。
>>112
実験では現在と比べて約40%のindex容量が削減できています。
今よりも多少はディスク容量を使わなくて済む予定です。 >>113
乙です
四割もすか、わくわくしながら待っています。 ∧_∧ ttp://www.geocities.jp/cen_hp/
( ・∀・) ドキドキ
( ∪ ∪
と__)__) 禁断の壷のDATが検索できないようですが未対応ですか? ∧_∧
( ・∀・)ワクワク
oノ∧つ⊂)
( ( ・∀・)ドキドキ
∪( ∪ ∪
と__)__) ∧_∧
( ・∀・) ドキドキ
oノ∧つ⊂)
( ( ・∀・) ワクワク
oノ∧つ⊂)
( ( ・∀・)
∪( ∪ ∪
と__)__) ,、ァ
,、 '";ィ'
________ /::::::/l:l
─- 、::::;;;;;;;;;`゙゙''‐ 、 __,,,,......,,,,_/:::::::::/: !|
. : : : : : : `゙'ヽ、:::゙ヾ´::::::::::::::::::::::`゙゙゙'''‐'、. l|
、、 . : : : : : : : : r'":::::::::::::::::::::::::,r':ぃ::::ヽ::::::::ヽ!
.ヽ:゙ヽ; : : : : : :ノ::::::::::::::::::::-=・=-、゙::: -=・=-:'、
. \::゙、: : : :./::::::::::::::;、-''":::::::::: ,...,:::,::., :::':、
ヽ:ヽ、 /::::::::::::::::::::::::: _ `゙''‐''" __,,',,,,___
`ヽ、:::::::::;;;、、--‐‐'''''',,iニ- _| 、-l、,},,  ̄""'''¬-
_,,,、-‐l'''"´:::::::' ,、-'" ,.X,_,,、-v'"''゙''yr-ヽ / ゙゙'ヽ、, ゴリゴリゴリ・・・
,、-''" .l:::::::::::;、-''" ,.-' ゙、"| / 冫、 ヽ、
l;、-'゙: ,/ `| /| | /. \
,、‐゙ ヽ:::::..,.r'゙ (( // | | / ヽ. マズッ・・・
,、‐'゙ ン;"::::::. U .U / >>118
' //::::::::: {.
/ ./::::::::::::: ',
. / /:::::::::::::::::. ',.
>>116
どうもです。
検索できるのは、2chのサーバにあるそのままのdatファイル
のみになっています。
こんな感じのファイルです。
http://pc11.2ch.net/software/dat/1204107839.dat >>120
そうですか・・・
壷はファイルの先端に今取得した時間と前取得した時間とレス数追記して
生DATとは違うファイルになってるから対応するのは面倒そうですね・・・ 壷のDAT見た限り0x88(136バイト)目まで壷DAT用のヘッダー?に上のレスで書いたやつを追記してるみたいですね。 今手元の壷用DATの先端0x88(136バイト)を削ってDATでThreadSearchを使用して検索できた事を報告しておきます。
使用する時はこれでいきます。
素晴らしいソフトありがとうございます。 へぇ
Jane系だとメタ情報はidxファイルに分けるけどね
>>120
1行目の読み出し時に自動認識できそうな気がしますがいかがでしょうか? できそうな気もしますが、壷を入れてdatをいろいろ見てみないと
いけないので、ちょっとめんどうかも。
それに今作ってるのやつがあらかた出来上がっているので。 スレッド全文検索を更新しました。
Ver 1.60になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
インデックスを改良して高速に作成、検索できるようにしました。
ウインドウサイズを記憶するようにしました。
検索結果の下ペインに上ペインのリンクを追加しました。
インデックス化の方法を変えたので、今までのものより
約2〜3倍 高速に検索できます。
場合によりそうでない時もありますが。
あと、インデックス作成時間も短くなりました。
詳しくはこちらを
http://www.geocities.jp/cen_hp/threadsearch.html キタ━━━ヽ(゚∀゚)ノ━( ゚∀)ノ━( ゚)ノ━ヽ( )ノ━ヽ(゚ )━ヽ(∀゚ )ノ━ヽ(゚∀゚)ノ━━━!!
へ ) ( ノ ( )ノ ( ) へ ) へ ) へ )
> > < < < > > えーすまん。
>詳しくは
と、readme.txtを見たけど、INDEXの追加作成は可能になったの? >>130
すみません。
書いてなかったです。
今回のバージョンでは追加(更新)の機能は付いていないです。
次回で付ける予定です。 >131
ありゃ残念。
でも次回更新を楽しみに待ちながらVer1.6使わせていただきます。 >>135
そういえば、誤反応スクリプト無効化ソフトはアイコン作ってましたが、
これは作って無かったですね。
とりあえず、ぼちぼち更新部分作ってます。
ちょっとトップの説明変えてみた。
http://www.geocities.jp/cen_hp/threadsearch.html ログの結果が、「日付+時間」のフォルダではなく、指定したフォルダに毎回上書きができるとありがたいです 要望追加で
検索日付範囲が固定されてしまうとバッチ処理には不便なので
今日のみ とか 何日前まで などができるとありがたいです あのねあのね
デスクトップにショートカット作って置いてるんだけど、
次のバージョンアップでアイコン付けて。 スレッド全文検索を更新しました。
Ver 1.70になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
インデックスを更新できるようにしました。
板で絞込みができるようにしました。
検索結果を保存するフォルダ名を指定できるようにしました。
アイコンを付けました。
検索語句を半角スペースで区切ることでAND検索ができるようにしました。
→「AAA BBB」だとAAAかつBBBがあるレスを検索します。 インデックス方法は1.60と同じですので、検索速度はほぼ同じです。
多少インデックス作成時間が短くなりました。
あと、アイコンが下手なのはセンスがないからです。 index作成中もしくはindex一覧?(最初にファイル一覧作るやつ)作成中に
janeで新たにログを取得しちゃっても問題無いのでしょうか?
index作り損ねたログは次回のindex更新に回るから平気?
作成開始から4時間で9%ほどなのでついついjane起動して2ちゃん
巡回始めちゃいました。
もちろん作成終了までソフト停止するつもりはないのですが。 どうもです。
>>147
問題ないです。
インデックス作成では下の流れになります。
1.インデックス化するファイルリスト作成
2.インデックス作成(ファイルリスト使用)
1が終わってから取得したスレッドは2で反映されませんが、
次回のインデックス更新には反映されます。 >148
了解しますた。
夕べ19時半から始めて現時刻92%
ハァハァあと少しだ。 >>149
どんだけ時間かけてるんだww
がんばれー 買い物から帰ってきたらおわってたー。
スレッド全文検索による計上でdatファイルが765,875個あった場合
24時間は掛からないと参考までに。
index作るのに掛かった時間をその回だけでいいから
どこかに記録残してくれると他者の参考になりそうなんだけどね。 一応ですが、インデックスを更新する時には、
現状のインデックスと同じくらいのディスク容量が必要です。
ちょっと気をつけてください。 >153
テンポラリですかね?
CドライブにOS
DドライブにJaneログ
Dドライブにマウントした実質別ドライブにthreadsearch本体&INDEX
なんですが、どのドライブで空き容量が必要になりますか?
もっともCとマウントしたドライブにはINDEX以上の空き容量はあるのですが。 >>154
そうです。
一時的に必要な領域です。
インデックスを参照するので、threadsearch.exe と同じディレクトリに
インデックスとほぼ同じ領域が必要です。
上ならDドライブです。 やっと規制解除。。。
とても、乙です
新バージョン1.70楽しみー
さぁ、寝てる間に動かそう うーむ、全板のINDEXが17.6GBあり、スレッド全文検索ver1.70内で
指定したターゲットの板ログが4.75GBでファイルが47,182個の中から
「IPv6」って単語を検索し始めて18時間位経ったけどまだ「インデックス読み込み中」
表示でバーがピロピロしてる orz >>158
どうもです
まだ検索中ですか?
量が多くてもそれは遅いと思います
他の10文字や20文字などの文字数が多い
言葉でも遅いですか?
そうならバグがあるかもしれないです。
それからインデックスを使うと、検索時に全ての
インデックスを流し読みします。 結局バーはピロピロ動いているのですが、検索が終了しないので中止しました。
IPv6を指定した板は見た記憶があった程度で本文をと思い検索させたのですが、
今回は一端あきらめて、今度は自作板を指定して必ず検索ワードがある「HighPoint Technologies」を
検索したところ検索終了されるまでは、23時25分52秒開始で23時50分00秒で「インデックス読み込み中」
あ、あれ?落ち着いて考えタスクマネージャを開いたところCPU使用率0%でメモリも32,296Kのまま何も動いて
ないです・・・
indexファイル・17.6GB・ファイル数2247個、自作板ログ・620MB・ファイル数5507個 >>160
どうもです。
多分バグがあると思います。
インデックスの作成か読み込みにバグがあるのではと思います。
インデックス化する範囲を狭くするとうまくいくかもしれません CPU100%で無限ルーうかと思いましたがちょっと意外です。
調べてみます。
>>160
threadsearch.exeのあるフォルダの中のindexのフォルダにある、
read_list.txtは検索時に出来ていますか?
あるなら最後の行は何になっていますか? AOpenマザーi855GMEm-LFS
PentiumM 1.5G
windowsXP SP3
OSの入ってるHDはマザーIDEマスタに繋いだシーゲートST3320620A
janeログはマザーIDEセカンダリに繋いだシーゲートST3500630A
threadsearch.exeとindexフォルダにあるのはマザーオンボの
Promise PDC20579のSATAポートに繋いだMaxtorの6L200P0をSATA変換で
Dドライブ空きフォルダにマウントって環境です。 00時10分現在「HighPoint Technologies」も検索されなかったので中止。
で、ご指摘のread_list.txtを見ると、そのファイル無いです・・・
indexフォルダには
file_list_0.txt〜file_list_747.txt、file_time_0.txt〜file_time_747.txt、
maked_path.txt、memory_0.txt〜memory_747.txt、path.txt、search.txt
だけです orz
動作中にもread_list.txtは作成されていません。
(本文のみのチェック、本文と板指定にチェックのいずれも) とと、みなさん何も言ってないのであくまで私の環境のみの現象
なんでしょうね。
どうぞごゆっくりお休みください。
当方もindexフォルダを消し再度index作成等やってみますので、何かプログラマ的に
気が付いたら又お願いします。 >>164
レスをありがとうございます。
read_list.txtはインデックスを読み込む際に作成されます。
正しくインデックスを読めていません。
プログラムのバグではないかと思います。
とりあえず、インデックス作成フォルダを別のフォルダにしてみて、
インデックスの容量を小さくしてみてください。
想定外のdatファイルをインデックス作成時に読んでいるかもしれません。 >>165
せっかく時間かけてプログラム動かして頂いたのに
すみません つー事で、ログ容量はそのままにしてindex削除→再度indexを作成、
DドライブマウントをやめてFドライブレター割り当てでもっぺん自作板指定で
「HighPoint Technologies」を検索しながらindexフォルダを見てますが、
やはりread_list.txtというファイルは作成されませんです。
インデックス読み込み中・・・ すぐじゃ作られない?と思い、読み始め10分後に見ても
read_list.txtは作られてないです。
なので今度はINDEXフォルダから手作業で
file_list_0.txt〜file_list_299.txtまでを残し、以降file_list_748.txtまで削除。
file_time_0.txt〜file_time_299.txtまでを残し、以降file_time_748.txtまで削除。
memory_0.txt〜memory_299.txtまで残し、以降memory_748.txtまで削除。
で、再検索後フォルダを見ながら10分待って最新の情報に更新してもread_list.txtは
フォルダに出てこないので検索中止・・・
なので、各99.txtまで残し手作業で削除。
read_list.txt出来ない orz
やけっぱちで各09.txtまで残し以降削除。
read_list.txt出来たー
が削除した各10〜748までのリストの内容までは知らんかったので
read_list.txtの中身は真っ白のファイル。
各10.txtを戻してもread_list.txt出来る。
各50.txtまで戻す、read_list.txt出来る。
各70.txtまで戻す、read_list.txt出来ない&CPU使用率99%から0%になっても「インデックス読み込み中」 しょうがないので各.txtを70から一つずつ減らして確かめたところ
各52.txtまでread_list.txt出来ました。(各53.txtを戻したり消したりで2回確認)
各53.txtにするとCPU99%から25秒ほどで0%になりread_list.txtも出来ないまま「インデックス読み込み中」表示
PC搭載実搭載メモリ2GB、windowsxp sp3 NTFSオプションデフォルトフォーマット
file_list_0.txt〜52.txt=4,739,593(4,820,992)バイト、file_list_53.txt=89,455(90,112)バイト
file_time_0.txt〜52.txt=651,264(651,264)バイト、file_time_53.txt=12,288(12,288)バイト
memory_0.txt〜52.txt=1,409,772,627(1,409,880,064)バイト、memory_53.txt=20,298,710(20,299,776)バイト
括弧()内はエクスプローラでファイルのプロパティを見たときのディスク上のサイズって方です。
各52.txtまでで1.31GB、53.txtを増やしても1.33GB。
自分で書き出してみたけど搭載メモリ容量はread_list.txtが作られないのに関係無さそう。
古いDATは9桁とかjaneのログフォルダにあったりますが関係ないんでしょうね。
file_list_52.txt・53txtとfile_time_52.txt・53txtに9桁DATは出てきてないですし、
memory_52.txt・53txtは中見ても何々が書いてあるとは言えない暗号文ですね。
素人の書き出し&試しですが、何かの参考になれば幸いです。 私の環境では現状使えませんが、グーグルの個人情報取得利用などを
ようつべだったかな?にアップされてたのを見ちゃうと、ネットに繋がってる
検索バーでローカルディスクを検索するのはちょっと嫌なので、cenさんが作って
くれてるのはとてもありがたいです。>167
ま、ネット検索はグーグルを使ってますが^^; >>168-170
調べて頂いてありがとうございます。
インデックス読み込み時のバグだと思います。
おそらくなのですが、以下の原因によりバグが出ています。
・インデックス読み込み時
「HighPoint Technologies」を検索語として分解すると次の19の部分に分解されます。
「Hi,ig,gh,hP,Po,oi,in,nt,Te,ec,ch,hn,no,ol,lo,og,gi,ie,es」
分解した検索語ごとにインデックスを読み、バッファに保存します。
バッファの必要数は以下の式で出ます。
必要なバッファ=バッファ「分解した検索語×インデックス数」
バッファの最大数は1024となっています。
これを超えるとバグになってしまいます。
この場合
分解した検索語=19
インデックス数=53(0〜52)
19×52=1007(1024以下なので正常に読み込み完了)
分解した検索語=19
インデックス数=54(0〜53)
19×53=1026(1024以上なのでバッファを超えてしまう)
バッファが不足している場合を考慮してなかったために、
正しく検索出来ていなかったと思います。
もしかしたら別の原因のバグもあるかもしれません。
次の更新時に修正しようと思います。
バッファは多分1024もあれば十分だと思ってました。すみません 必要なバッファ=バッファ「分解した検索語×インデックス数」
↓
必要なバッファ=「分解した検索語」×「インデックス数」
でした なので上の場合だと、500近くインデックスがあるので、
検索語が一文字か二文字なら今のバージョンでも
うまくいくはずです ごみ箱から戻したつもりだった各○○.txtが全部戻ってなかったー・・・
いや、新バージョンが来たら再度最初からindex作成するつもりだったので
それは良いのですが。
>検索語が一文字か二文字なら今のバージョンでも
>うまくいくはずです
で、各99.txtまで戻っていたので「HighPoint Technologies」ではなく
「IP」と二文字検索させたらちゃんと検索終了しread_list.txt作成されました。
ご報告まで。 スレッド全文検索を更新しました。
Ver 1.80になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
・インデックスの構成と検索語により、検索できない場合がある
不具合を修正しました。
・7日間以上インデックス更新をしなかった場合にメッセージを
表示するようにしました。
・指定したスレッドをHTML化して表示できるようにしました。
インデックス方法は1.60、1.70と同じです。 >>176
乙です!
>・指定したスレッドをHTML化して表示できるようにしました
めちゃくちゃうれしいです
使ってる人少ないんかね?
まぁオレもVer 1.80は即日落としたけど、PC作業中だったので
ついさっきからindex作成し始めたから出来上がりは明日の
19時くらいだな。 index生成時間がさすがに長すぎる・・・
便利そうなんだけどなぁ 馬鹿カキコだけど、誰かのindexファイルをフォルダごと貰って使ったらどうなんだろう?
indexをあげる人と貰う人の所持ログ次第だとは思うけど、巡回板がほぼ同じ趣味同士なら
index更新だけでうまくすれば短時間で生成? >176
>インデックスの構成と検索語により
あー、その張本人っす。
今回は無事に検索出来ました。
が、indexの更新が出来ないような・・・
勿論当方のログフォルダ内容構成等の問題はあるかもしれませんが、
プログラマ的にindexが更新出来ない理由が有るかもしれないので
ご報告しておきます。
相変わらず素人の報告で申し訳ありませんが、下記のようになってます。
renewフォルダが作られ、中にfile_list.txt
中身
D:\Program Files\Accessories\2ch\2chjanelog\Logs\2ch\AA\AAサロン\1041132902.dat 1204642027 0
のようなテキストが766,859行ありfile_list.txt全容量79,437,535 バイト
index_file_list.txt
中身
D:\Program Files\Accessories\2ch\2chjanelog\Logs\2ch\AA\AAサロン\1041132902.dat 1204642027 0
のようなテキストが766,817行あり、766,818行目から766,976行目まで
NULL NULL 748
となりindex_file_list.txt全容量79,435,120 バイト
renewnow.txt中身
0
が一文字で
「インデックス更新中・・・0%」のままバーがピロピロしてますがCPU使用率0%のまま orz
indexフォルダ17.7 GB
indexフォルダがある単独Fドライブ空き容量94.2GB 質問なんですが
「ここ」と示されているリンクをクリックするとdatファイルが開くのですが
ここをクリックするとjaneが開くようにする方法はありますか?
ttp://vip.cmdap.com/cgi-bin/uploader/pic/file/vipnion-pic_0385.jpg
>>184
今の最新バージョンだとスレをHTML化できるけど、それは? Get some bumper stickers made up and put them on your car, http://geocities.com/samhebert37/netwitz.html Netwitz
, hfqjf, http://geocities.com/andrewalton92/shinnfu.html Shinn Fu
, wmsoq, http://geocities.com/wattslaverne29/fdarepackagesupplementslaw.html Fda Repackage Supplements Law
, 174, http://geocities.com/martinhale68/triatholon.html Triatholon
, 5165, http://geocities.com/sandersberry82/dubrows.html Dubrows
, 788633, http://geocities.com/felipehinton61/hillspet.html Hillspet
, oboji, http://geocities.com/maura_summers/nickyoneill.html Nicky Oneill
, :-[, http://geocities.com/marshallguzman61/pinoyspy.html Pinoyspy
, ezlcsg, http://geocities.com/sethcantu25/backaid.html Backaid
, apna, http://geocities.com/meredithosborne69/1949studebakertruckforsale.html 1949 Studebaker Truck For Sale
, 7683, http://geocities.com/russellove46/lazerrangefinder.html Lazer Range Finder
, sizgi, http://geocities.com/lawrencebradford85/prairieragwort.html Prairie Ragwort
, 5423, http://geocities.com/salvadorcox73/beautitudes.html Beautitudes
, kdo, http://geocities.com/claudiodickson73/aiincomputergamedodgem.html Ai In Computer Game Dodgem
, :[[, http://geocities.com/billygraves60/norelco7845xl.html Norelco 7845xl
, 4498, http://geocities.com/antonsavage54/castlerockrefractivesurgery.html Castle Rock Refractive Surgery
, 8PP, http://geocities.com/jeremyglover59/bedandbreakfastinhanamaui.html Bed And Breakfast In Hana Maui
, =(, http://geocities.com/mylesreynolds34/austrailianflag.html Austrailian Flag
, 28741, http://geocities.com/antonsavage54/ifchildrenlivewithcriticismaristotle.html If Children Live With Criticism Aristotle
, 8OOO, Your email software will have a place to format your digital signature, http://geocities.com/navarrobenny80/bradbuffum.html Brad Buffum
, 1520, http://geocities.com/darenharding27/gailengvall.html Gail Engvall
, fpgjq, http://geocities.com/darlabarry25/dougwaughiss.html Doug Waugh Iss
, 8628, http://geocities.com/abehenry33/maritesvitug.html Marites Vitug
, 8))), http://geocities.com/blainecortez40/hersheyskissesfondue.html Hersheys Kisses Fondue
, %OO, http://geocities.com/billygraves60/culinariareceitadeboloflorestanegra.html Culinaria Receita De Bolo Floresta Negra
, 229, http://geocities.com/knight_elma/entourage405torrent.html Entourage 405 Torrent
, 197, http://geocities.com/nealbullock80/amypickerill.html Amy Pickerill
, 075406, http://geocities.com/abehenry33/westjetflights.html Westjet Flights
, %DDD, http://geocities.com/sethcantu25/remingtonspr310.html Remington Spr310
, fxaqa, http://geocities.com/antonsavage54/daisydux.html Daisy Dux
, =-DDD, 5mm range is appropriate, http://geocities.com/odisavery46/ruhterauction.html Ruhter Auction
, :-[, http://geocities.com/mitchellsantana60/your4state.html Your4state
, 4147, http://geocities.com/johnston.lessie/kything.html Kything
, >:-OO, http://geocities.com/edwinherrera89/ujikosearchenginecustomizationd.html Ujiko Search Engine Customization D
, pbgnqk, http://geocities.com/hoganjohnny77/godingersilver.html Godinger Silver
, 8-))), http://geocities.com/edwinherrera89/yamahawarrioratvtrailerhitch.html Yamaha Warrior Atv Trailer Hitch
, 8O, http://geocities.com/winstonsheppard79/tindendriticelectromigration.html Tin Dendritic Electro Migration
, jqkrnf, http://geocities.com/nelsondustin/deurkrukken.html Deurkrukken
, :-]], http://geocities.com/federicopugh89/beggarsstatisticstanzania.html Beggars Statistics Tanzania
, >:DD, http://geocities.com/ronhawkins51/mothersdayscrapbooksayings.html Mothers Day Scrap Book Sayings
, 39896, http://geocities.com/mercerbryan23/2004sierraduramaxcrewcab.html 2004 Sierra Duramax Crewcab
, 70456, >>185
レスthx
その機能で代用します
今後janeで簡単に開く機能を搭載することができたらお願いしたいです >>181
どうもです。
長いと思いますか。
自分もたまに思います。
マルチコアで作成できるなら、速くなるかと思ってます。
できるかは分からないですが。 >>182
インデックスをあげる人と貰う人が
インデックス化したdatと同じものを持っていればできます。
その場合、datのパスも同一でないといけないので、
他の人から貰うのは難しいと思います >>183
教えて頂いてありがとうです
その現象は更新時に、インデックスのファイルと
現在のファイルを比較する時に起きているバグだと思います。
想定外のファイル数だったので、メモり確保できなかったのだと思います。
datファイルが1万個程度で考えていました。
多分10〜20万個のdatなら更新できるのではと思います。
バグなのでプログラムを見直します。 製作者が想定してない&動作実験出来ない環境でインネンつけてごめんなさい。 >>195
いえいえ
このくらいは想定すべきでした どうもです
今はMonoViewの方を更新中ですので、こちらは少し待っててください。 スレタイだけで検索すると、キーワードに該当するスレのすべてのレスをリストアップしようとするんだけど
スレ(もしくはスレの>>1)だけリストアップするようにならないかな
内容検索のソフトだからお門違いだとは思うんだけど… ttp://poiu.jp/
スレタイ検索しかできないけど、こういうので全文できるようになったらよさそう。 >151以降のインネン付けてるバカ本人ですが、当時ペンM1.5G で24時間ちょい切る
程度だったのがQ6600だと多少ログ増えてるにも関わらず8時間程でindex新規再作成終了。
(当環境だとver1.8でindex更新出来なかった為新規作成)
>193の件はまったりverアプ街ん子 ログ容量とか検索ワード数とか、しょーもない制限しないで。 正規表現を使っての検索があったらすごくうれしいです 保守どうもです。
すみませんが次のバージョンはまだ手がついて無いです。
一応、作るつもりではいます こんにちは。
数少ないインデックス検索型の過去ログ検索ソフトということで期待しております。
>>190でも出ているのですが、
Jane等2chブラウザに簡単にURLを渡す方法はないでしょうか? 現時点での検索精度はいかほどでしょうか?
例えば"きりたんぽ"で検索した場合、
文中に"きりたんぽ"という語句を含むスレを
何%程度抽出可能ですか? どうもです。
>>220
今のところは無いですね。
代わりで>>185の方法があります。
>>221
100%抽出できます。
インデックス化したログのみ検索しますが、インデックス化すれば
検索語句を100%抽出できます。 補足
インデックス化は全文に対して行います。
なので、検索は一瞬ではできませんが全部の文章から検索できます。 >>222-223
ありがとうございます。
これではかどる >>213
ファイル数の制限は付けると思います。
今のところ、ファイルパス+ファイル名が平均128文字なら100万ファイル
程度まで使えるようにしようかと思ってたり。 スレッド全文検索を更新しました。
Ver 1.81になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
ファイル数が大量にある場合にインデックスを更新できない不具合を修正しました。
とりあえず、その1点だけです
他はまたぼちぼちやります VistaUltimate x64なんだけどどうもインデックスが作成できない模様
path.txtのみ生成されファイルリスト作成中のまま WebサイトとReadmeに64ビット環境では動作しないって明記しておいてくれよ
だいぶ前から分かってたみたいだけど作者は64ビットに対応する気はないの? これってexeの設定がおかしいんじゃない?
dllが32bitモード専用なのに、
「64bitOSでも32bitモードで動かして下さい」
とせずに、
「64bitOSでは64bitモードで動かして下さい」
って設定になってる気がする。 とりあえず
当方の機器構成で不具合無しで使わせてもらってます。 インデックスを使用しない検索はどいうしくみなんだろう
何度か試したけど、janeやgrep系ツールで15分くらいで終わる検索が
1時間以上かかる・・・ >>236
1スレッド1レスごとに、名前や本文などに分解して検索します。
他のツールより遅いかもしれません それから、スレッド全文検索を更新しました。
Ver 1.811になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
64bit Windowsで動作しない不具合を修正しました。 教えて
他のスレから貼り付けてあるレスのIDから
その元のスレッドはどこで検索したらわかりますか? >>243
探したいスレをログに持っていれば、ID欄にIDを入れればできます。 わけあって2ちゃんブラを2種類使用してます。2個以上の検索フォルダを作るようにできないでしょうか・・・ >>245
V2Cを見てみましたが、何か外部コマンドがいろいろあるようですね。
使えると面白いかもしれないです
>>246
ドライブが同じなら「C:\」とか設定してみてください。
2chのdatファイルのみを検索するようにしていますので、
C:\とかでも大丈夫だと思います。 要望なのですが、
ネットワークパスへの対応をお願いできないでしょうか
検索フォルダが他のPCにあるもので。
今はネットワークドライブを割り当てれば大丈夫なようなのですが
できればネットワークパスのまま検索を行いたいです。
>>249
ネットワークごしで使うとは意外でした。
そういう要望があるとは。
あと、検索フォルダを2つ以上という要望が割と多いような気がします。 janeログがDドライブ
スレッド全文検索実行ファイル他&indexがEドライブ
o2onログもEドライブ
なので今はjaneのDドライブだけ検索。 こんばんは
スレッド全文検索を更新しました。
Ver 1.82になりました。
http://www.geocities.jp/cen_hp
・更新点は以下です。
・追加検索フォルダを指定できるようにしました。
・更新日が〜日前以降のみのファイルを検索できるようにしました。
・インデックス作成・更新の進捗表示を変更しました。
こんな感じです。
http://www.geocities.jp/cen_hp/threadsearch180/top.png 更新乙です。
作業後に新しいのに入れ替えて4日ぶりにindex更新しようと思います。 どうもです。
そういえば、追加検索フォルダで長いフォルダ名だと
全部表示されないですね。
作るときに気がつかなかったです。 ちょっとお尋ねしたい事が。
index作成中及び更新中に待ちきれずにjane起動しログを追加取得しちゃった
場合ですが、threadsearch.exe実行中のピロピロ動いてるバー終了間際で
パソコンがリブートしちゃう気がするのですが、threadsearch的プログラムで
PCリブートなんてありえる事なんでしょうか?
Ver1.82ではindex更新中にログ取得は控えているのですが、
前のバージョンでは待ちきれずログ追加した場合に何度か
リブート食らったものでちょっと疑問に思いました。
もちろん更新中にログ取得しなければ今のところリブートしていないので
とっても愛用させていただいてます。 >>255
使って頂いてありがとうございます。
リブートですが、再起動するようには作っていません。
threadsearch.exeのせいかも知れないですが、原因は不明ですね。
更新中や作成中にログの追加削除をしても、こちらの環境では再起動する
ことはありませんでした。
そういう現象もあることを覚えておきます。
伝えて頂いてどうもです。 index作成及び更新が終わったらPCの電源を切るって
オプションは付けられないでしょうか?(何時でも取り消し可能で)
一応こゆフリーウエアはありますが、自前で機能を持っててくれたらうれしいなと。
ttp://trendy.nikkeibp.co.jp/article/tec/online/20020724/101278/
ttp://homepage3.nifty.com/t-sugiyama/
>>258
コマンドラインで「index作成したら終了って機能」があれば、バッチで処理できない?
PCの電源きる方法なんていくらでもあるので >260
スマン、馬鹿なオレにはマウス使ってチェックボックス・チェックマークがいいんだ・・・ >>256
窓最大化したとき次回も最大化状態でお願いん。
適度な大きさで使いたいときと最大化で使いたいときとあるので。 ご意見ありがとうです。
インデックスが大きい場合は、時間がかかるのでPC自動オフが便利かもしれないですね。
ウィンドウの状態は最大化して使わないので、気がつかなかったです。 こんばんは
スレッド全文検索を更新しました。
Ver 1.83になりました。
http://www.geocities.jp/cen_hp
・更新点は以下です。
追加検索フォルダが長い場合にパスが見えない不具合を修正しました。
最大化した場合のウインドウサイズを記憶するようにしました。
インデックス作成速度が約15%高速化しました (旧バージョン比 1.15倍)
インデックス更新速度が約100%高速化しました (旧バージョン比 2倍)
インデックス更新が速くなったので、PCの自動オフは付けていません。
インデックス形式やiniファイル形式は同じなので、
解凍して上書きして貰えればおkです そういえば、使い方をもう少し詳しく書くのもいいかもしれない。 何か引っかからないと思ったらjaneに自分で追加した板のログは対象にならないんですね
一応インデックスは作ってるように見えるけど >266
更新 乙
19:30 index更新開始 >>269
使って頂いてありがとうございます。
検索できないのは板を指定しての検索ですか?
板を指定できるのはbbsmenuにあるもののみになります。
それ以外に、曜日などの条件を付けていませんか? インデックス更新中(Step1/2)・・・ファイルリスト作成中 68%完了
電源OFFがやっぱり欲しいです m(_ _)m 更新失敗
インデックス更新中(Step1/2)・・・ファイルリスト作成中 99%完了
この99%がずーと続いてたのですが、PC突然リブート食らいました。
私固有の問題だと思うのですが、この99%が続いてる段階(CPU Q6600タスクマネージャで
threadsearch.exe約25%使用)でモニターが点いてると落ちる気がします。
何故かモニター消して寝ちゃうとStepが2に行ってて作成や更新で失敗しないのですよ。
マザーP5WDG2 Pro+グラボHD4870+メインメモリの相性が悪い気も多々しますが・・・
>>273
それは、ハードウェアのもんdないじゃな? >274
うん、自分のPCが悪い気はしてるんだけど、ど素人のボクには
もしかしたらthreadsearch.exeのメモリ確保?になんか変なところが
あるのかなぁと。
>>275
モニタが点いていないとうまくいくのであれば、
threadsearchの問題では無いと思います。
メモリ管理などに問題があれば、モニタに関係なく落ちるのではと
思います。 >276
了解しました。
初めてRADEON使ったらどうもグラフィック関係が不安定なので
RADEONのメモリ+マザーメインメモリ+アプリの利用メモリの3連で
不具合が起こってると疑っていました。 こんばんは
スレッド全文検索を更新しました。
Ver 2.00になりました。
http://www.geocities.jp/cen_hp
・更新点は下記です
追加検索フォルダが無いと、ウインドウ最大化設定が正しく行えない不具合を修正しました。
インデックスに本文以外に「名前」「メール」「ID」「スレタイ」を追加(インデックス作成が1.83より多少遅くなります)。
検索オプションに「1スレあたり1レスのみ」を追加。
インデックス更新を高速化しました(ファイルリスト作成を効率化)。
インデックスの書き込み方がそれまでと異なるので、旧バージョンをお使いの方は
インデックスを再作成してください。 インデックス検索が「本文」「名前」「メール」「ID」「スレタイ」で
できるようになったので、2.00にしました。
あと、インデックス作成速度<更新速度 が
インデックス作成速度<<<更新速度 くらいになりました。 このごろ気がつきましたが、「<<」では正しく検索できない
バグがありますね。 何か最小化して終わるとウインドウの大きさが元に戻る レスありがとうございます。
ウインドウステータス(サイズ)は2.00では記憶され、
不具合は>>284のみだと思ってます。
2.00でもウインドウサイズが記憶されてないですか?
(最小化は記憶しません) こんにちは、詳細に検索ができる、と聞きdatEから移行してきました。
少しお聞きしたいのですが、インデックス作成後、検索すると
自動的に既定のブラウザが開き、フレームわけされた検索結果が表示されます。
動作的にはこれでよいものでしょうか?
readme.txtによると検索タブ?で検索結果が開くように見えるのですが…
あと2chブラウザにレスのURLを上手く渡す方法はないかな…。 どうも古いの落としてたらしくて、最新版でインデックス再生成してみたのですが、
メモリー食いすぎてスワップしまくって重くなて死ぬかと思いましたww
今の時代はメモリーは安いし、もっとつめ!で済む話といえばそうなのですが。
インデックス作成中500MBくらいメモリーを食ってましたが、
参考までにこのソフトのインデックス作成、検索のアルゴリズムって何をおつかいなのでしょうか?
datEは検索エンジンはHyperEstraierで、N-Gram使用ということみたいですが…。 ごめん、>>52で
> あと、方法は独自と書きましたがほぼngram法です。
とありますね…。
datEだとインデックスが1GB超えるのに、このソフトだと300MB以下で収まるのびっくり。
datEだと検索は数秒とかなり高速ですが、細かい絞込みができないので使い分けという感じがしますね。 >>283
もう一度動きを見ていると、そうかもですね。
起動(非最大化@)→大きさ変更(非最大化A)→最大化→終了
→起動(最大化)→最大化解除→非最大化@の大きさになる >>287-289
どうもです。
>>287は結果が正しく表示されていないです。
今でもそうですか?
そうなら環境を教えていただけないでしょうか。
>>288
このソフトだけだとインデックス作成、更新時に約260MBのメモリを使います。
メモリを沢山使っているなとは思っています。 >>290
ありがとうございます。メニューの設定の保存を実行しておけば大丈夫ぽいです。 オマイ等ソフトウェア板の1普通に表示出来てる?
昨日OS再インスコ後に今日始めてソフ板に繋いだんだけど、ソフ板の1が
http://pc12.2ch.net/software/1 名前:名無しさん@お腹いっぱい。 [sage] 投稿日:2008/02/27(水) 19:23:59 [夕方] ID:LnN9ZP+r0 (PC)
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな
↓にて上記のように表示されるようになってしまった。
【JaneStyleのバージョン】 Jane Style Version 3.10 (3.1.0.0)
【 Windowsのバージョン 】 WindowsXP Professional [Service Pack 3]
【 IEのバージョン 】 8.0.6001.18702
ま、このスレとは関係無いんだけどね。
インデックスのサイズでかくなってきたので別ドライブへ保存できるといいなー >>250
GbEなら480MbpsのUSB接続HDDよりすでに速いし、
NAS上にインデックス置きたくなっても不思議はないと思う >>294
インデックスだけ別ドライブですか
今はソフトごと別の場所に移動しても問題なく使えます
>>296
NASだとWindowsでネットワークドライブの設定をすると、
普通のドライブと同じように使えるので、今はその方法で使ってください
こんばんは
スレッド全文検索を更新しました。
Ver 2.01になりました。
http://www.geocities.jp/cen_hp
更新点になります
・ウインドウサイズが記録されない不具合を修正しました。
・スレタイを検索条件に入れると、対象スレッド内の一部のみしか
検索されない場合がある不具合を修正しました。
・結果のHTMLを保存できるようにしました。
・インデックス読み込みを高速化しました。
・検索語句のハイライト表示をできるようにしました。
インデックスの一部がそれまでと異なるので、
旧バージョンをお使いの方はインデックスを再作成してください。 うげろろろろろろろろろろろろろろろろろろろっ
2.01気がつかないで一昨日から18時間ほど掛けて
2.00でINDEX作っちゃった・・・
でも
>298
更新おちゅ
18時間もかかるのかよ。
永杉。30分ですむやつ作ってやるぜ。 2.01で一からインデックス再構築したら、31000スレ強で50分程度でした
CPUはPhenomX4 9150e あれ?アレレレレレレレレレレレレレレ?
何時もステップ1の99%で延々待ってからPCリブート(聞く所によると家の環境が糞)したり
ステップ2に行くのに、今回2.01だとあっさりステップ2に行った。
16時30分から作成開始して今ステップ2の1% だがしかーし
今ステップ2で15%になったばかり orz 時間が出来たので再度index作成に挑戦
本日03時開始後放置睡眠。
起床後13時位から動画鑑賞などPC使ってて15時15分にPCリブート。
うる覚えでステップ2の54%超えで12時間がパー・・・
いつまで経ってもINDEXが出来ない orz
>306
janeログフォルダ(87.4GB)とo2onログフォルダ(76.3GB)の2つを指定。
Q6600でメインメモリ2GB×4枚、XP32BitOS管理外メモリはRAMDISK割り当て。 みんなログをため込んでいるんだな
300MBしか無い自分は少数派なのか 俺150Mぐらいだったよ
1年ぐらい使ってタブは常時50ぐらい開いてるかな >janeログフォルダ(87.4GB)とo2onログフォルダ(76.3GB)の2つを指定。
すげえ。
サイズにして5GiB強、「ギリギリで無圧縮ではDVD-Rに入らなくなった」とか
嘆いてた自分は甘甘ですわ… o2onってことはp2p経由でも自動でログ貯めてるのかな?
うちは、3万1000ファイルで 1.3GBくらいだた。
全然ヘビーに使ってないけど長年使っている成果けっこういくな…
6,7年はやってる気がするから 16時から懲りずに作成始めてステップ2の35%位でまたリブート食らった・・・
今からもう一度始めて、これで落ちるようなら使用を諦めるっポ >>312
>>307で54%超えてたならログフォルダかたっぽずつやれば成功しそうな希ガス >>312
試しに、datEでもインデックス作ってみたらどうかな?
Datファイル全文検索ソフト DatE
http://frozenlib.net/DatE/
datEはインデックス化も検索も爆速なのはいいけど、TreadSearchみたいに絞込みが弱すぎるんだよな。
俺は併用してるよ 16時間半
パソコンを一切操作しないでおいたらindex出来たよ出来たよ。
(今まではブラウザをいじってるだけでも落ちてた)
>>315
勇者超乙w
出来たインデックスは40Gぐらい?
こんにちは。
近いうちに次のバージョンに更新します。
>>317
インデックス40GBはすごいですね。
こんばんは。
スレッド全文検索を更新しました。
Ver 2.02になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・「メール」「ID」が空欄のままでも、インデックス検索が動作する不具合を修正しました。
・インデックス作成速度が向上しました。(約2倍)
・インデックスサイズを削減しました。(約25%)
インデックス化のプロセスを見直して効率よく動作するようにしました。
それから、インデックスの無駄な部分を削減しました。 >>320
乙ですた!
作成速度と容量が削減されるとは>>317の泣いて笑う顔がみえますw
作り直して体感してみる?ww
今度は8,9時間、寝てる間か出かけてる間に終わってる(カモ) ちょっと要望があるのですが。
検索結果にスレッドURL、もしくはレスURLを表示(もしくはコピー機能)させることってできませんか?
ある単語で検索して、ヒットすればその周辺で関連の話がされていると思うのですが
ヒットしたレスを専ブラで開く方法がないように思えました。
# すでに実装されている機能でしたらごめんなさい。 >>322
欲しいなー
さらにに検索結果を本文ままにコピー出来たら鼻血でる
例えばこんな感じ
▲> 318 :名無しさん@お腹いっぱい。:2009/06/10(水) 13:10:22 ID:+wGlmcZn0
インデックス40GBwwww
↓
2ちゃんねるスレッド全文検索・・・ThreadSearch
http://pc12.2ch.net/test/read.cgi/software/1204107839/
318 :名無しさん@お腹いっぱい。:2009/06/10(水) 13:10:22 ID:+wGlmcZn0
インデックス40GBwwww
置換すればいいんだけどまとめてメモっておきたいときに楽、視認性アップです ついでに、2.02でインデックス作り直した結果です、、、
2.00時はうろ覚えで不正確
2.00 ログ約210MB index 約42MB
2.02 ログ236MB index 44.8MB
250MBになったらまた確認して正確な結果出します・・ん、2.00に置き換えて作り直せば完璧か! あ、作成速度向上・サイズ削減の比較対象が1.00とかだったり? 失礼しますた、うろ覚えすぎたようです
>>325修正
2.00 ログ236MB index 50.5MB
2.02 ログ236MB index 44.8MB
時間は計ってませんが、約8.9%の削減率(・∀・) あれ連投お許しをwww
約11%の削減率ですた(ノ∀・)アチャー オレメモ
V2.02にて作成時間が呆けてしまった(01:30から始めたと思ったけど脳ボケが始まったぽい。
ファイルリスト作成が01:30で実際のINDEX作成が2:50なのかな?)
INDEXフォルダのファイル日時02:50最旧時間、最新時間13:47
windowsXPのNTFSフォーマットでフォルダのプロパティにてディスク上のサイズ。
D:\Program Files\Accessories\2ch\2chjanelog\Logsフォルダ内
(画像キャッシュは別フォルダだが、janeのログフォルダは.idx・.db・その他があるのでプロパティ役に立たず)
ファイル数933,931個フォルダ数1,528にて 87.6GB
E:\o2on\datフォルダ内
ファイル数717,165個フォルダ数109,044にて 76.7GB
F:\threadsearch\indexフォルダ内
ファイル数5,852個フォルダ数0にて 32.2GB(41.6GBから随分減った)
threadsearch.exe実行にて詳細設定画面
ファイル数1,496,442個との事
>>322-324
その機能は無いです。
すみませんが、ログのフォルダからURLを特定できないのです。
ブラウザによって推測はできますが、特定できる情報が無いのです。
あると便利だと思いますが、推測のURLを表示したりすることになります。
>>324
なるほどです。
そういうメモがあると便利かもしれないですね。
>>325-329
書き込みどうもです。
ログとインデックスのサイズの参考になりました。
>>320の比較対象は2.01です。
現状ではインデックスサイズが一番大きくなるのが2.01です。
(memory_index_xx.txt などを追加しているため) スレのURLをある程度手動で設定したら、
もしかしたらできるかも? >>332
通常、URLからlogファイルパスを特定する時
ボード一覧からsrv+bbsに一致する部分があれば、そのカテゴリ、板名を取得するって感じだと思うのですが
逆にカテゴリ+板名から srv+bbsを取得するっていうのもできるんじゃないかなぁと。
専ブラのボード一覧とthreadsearchが取得したボード一覧が同じである必要性はありますが。
個人的には推測でもいいのでほしいところです。 2.02でまた一から再構築したら、45分に短縮された。
確かに早くなってますな。 要望です。
外部ツールから起動させるとDLLをロードしません。
カレントディレクトリをEXEフォルダに再設定する機能とかつけられませんか? >>333
レスどうもです。
実際にするとなるとファイル名も「1204107839.dat」などで同じに
する必要がありますが、できなくはないかもですね。
>>334
どうもです。
もしかしたらCPUの種類で短縮できる時間が
違うかもしれないです。
>>335
指摘ありがとうです。
カレントディレクトリの設定は行っていないので、呼び出し元の
ディレクトリがカレントディレクトリになりますね。
考えて見ます。
>>336
こっちであっています >>324
>>322 俺もこの機能はほしす・・・
連携させたい。
同じ全文検索ソフトのdatEは2chブラウザ指定して連携できてその点は使いやすい
しかし、こちらはスレタイトルで絞込みとか全然できないw
>>330
> ブラウザによって推測はできますが、特定できる情報が無いのです。
あれ?そうなんだ…
datEはどうやってんだろ datE参考に適当にアルゴリズムでっちあげた
・thread_number = スレッド番号
・idx_txt = thread_number + ".idx" のファイル名のファイルから中身を読む
・board_uri = idx_txtの6行目を抽出
( board_urlの例:http://anchorage.2ch.net/livemarket2 )
・board_uriを以下のように分解
・uri_scheme: URIスキーマ(例:http)
・uri_host: ホスト名(例:anchorage.2ch.net)
・uri_path: パス(例:/livemarket2)
※C#なら Uriクラスのnewにboard_uriを渡して生成すれば一発で全部取れる
Uri クラス (System): http://msdn.microsoft.com/ja-jp/library/system.uri(VS.80).aspx
・tread_uri = board_uriからスレッドURLを組み立てる
例:tread_uri = sprintf("%s://%s/test/read.cgi%s/%d/", uri_scheme, uri_host, uri_path, thread_number)
あとは、この tread_uri を指定の2chブラウザに渡せばOKのはず >>339
はJane依存(.idxファイルが)かもしれないので注意してください >>339-340
情報をどうもです。
多分DatEはJane専用のソフト(HPより)なので、その方法で
してるかもしれないですね。
他のブラウザも使えるようにすると、別の方法が必要だと
思っています せめて外部プログラムを指定してdatのパスとレス番を渡せれば
スクリプトでもかましてJaneで開くことは出来るんだけど 実行ファイルをNAS上に移したらエラーが出て起動できないんですけど… せめてインデックスだけでも別ドライブに置けませんかね… NASで動かしたらどうなるのか、あまり調べてなかったので
調べてみました。NASは持ってないのでPCをNASのように使ってみました。
@XP PCにThreadsearchをインストール Vista PCで使用
[Vista]→使用→[XP(Threadsearch)]
→起動可能、検索できるが検索結果が正しく表示できない
AVista PCにThreadsearchをインストール XP PCで使用
[XP]→使用→[Vista(Threadsearch)]
→起動できない
今のところ、全てローカルでソフトを使用することを想定してます。 検索結果にスレ立て日とか最終書き込み日とかスレ数とか情報を出したり
それで並べ替えとかできるようにならないですかね なんか勘違いをしていて、>>334は2.00で計測していたぽいです。
先ほど2.02で再構築した結果(約32500スレ、4.5GB)、30分で終わりました。
インデックスの容量も931MB→836MBと結構圧縮されてますね。
毎度ながら参考まで。 >>351
なるほどです。
並び替えられると結果が見やすくなりそうですね。
>>352
結果のレスをどうもです
割と容量を抑えられているようですね 起動できないって具体的にどう起動できないの?
ネットワークドライブで.NETアプリがダメ、という話なら、グループポリシーかなんかで設定変えられたはず >>356
起動できない→exe起動でエラー画面が出ます。
普段使わないので、グループポリシーなど知りませんでした。 ちょこちょこ更新しています。
どうなるかは分かりませんが、10月半ばまでには
完成させたいです。 >>358
エラーでたら、エラーくらい晴れよw
グループポリシーエディタはHOMEエディションには付いていない罠 記号も検索出来て便利だね
もっと早く使えばよかった
googleは記号の検索できないし
デスクトップサーチは検索しないディレクトリを指定する仕組みだし どうもです。
>>365
BEの発言者の検索はできません。
スレッドに書き込まれるBEの"キー"が違うためです。 こんばんは。
スレッド全文検索を更新しました。
Ver 2.031になりました。 (1日で2回更新しました。2.03と2.031)
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
2.03分
・「D:\」などのドライブ直下などに置いて動作すると、結果が正しく表示されない不具合を修正しました。
・カレントディレクトリが実行フォルダになっていない不具合を修正しました。
・BBSMENUからスレのURL抽出をできるようにしました。
・専用ブラウザでスレッドを開けるようにしました。
2.031分
・インデックス作成中・更新中に外部ブラウザを設定すると、
インデックスが正しく作成されない不具合を修正しました。 外部ブラウザについて、次のソフトで試しました。
・Jane Style 3.10
・MonoView 1.28 (非起動状態から)
・Live2ch 1.19 (非起動状態から)
MonoViewとLive2chは、起動しているとスレッドを
「スレッド全文検索」から開けません。
起動していない状態からだと、外部ブラウザとしてスレッドを
開くことができます。 >>367
キーのパターンがわかってるから可能ではないかと
>>365であれば基礎BE番号が185140で
そこから生成されるキーが55542511や111084421・・・
その中で書き込まれた>>365のキーは2332764476であると
be 全ID生成・解析所
http://snowslide.s201.xrea.com/be/ 2ちゃんねる内のスレであれば
beid = ((benum/100) + ((benum/10) % 10) - (benum % 10) - 5) / (((benum/10) % 10) * (benum % 10) * 3);
で求められるんじゃないかな。
他のBEは知らん 更新お疲れさまです。相変わらず素晴らしい検索速度(*´Д`)/ヽァ/ヽァ
> ・BBSMENUからスレのURL抽出をできるようにしました。
これどう使うのか分からなかったです。
専ブラ単体は使ってないので確認できませんが、firefoxのb2rなのでブラウザで該当スレ開けました >>373
Janeなんかだと、たとえばこのスレは(Gドライブに入れてあるので)
「G:\Program Files\Jane Style\Logs\2ch\PC等\ソフトウェア\1204107839.dat」 になる。
けど、専ブラに該当スレを開かせるにはURL形式でないとだめなので、
BBSMENUから
PC等/ソフトウェア → pc12.2ch.net/software
を取得するようにしたということだと思う。 というか、専ブラ連携ありがとうだぜ。>>368
かなり便利になった。
でも連携についてもうひとつお願いがあるのだが。
外部ブラウザに送る際にレス番号もつけてもらえないだろうか?
現Verだと、該当のスレのURLを送っているようで、該当スレまでジャンプしてくれない。
具体的に言うと
"G:\Program Files\Jane Style\Jane2ch.exe" http://pc12.2ch.net/test/read.cgi/software/1204107839/369
のような感じで。
ひとつのスレで2つ以上の検索結果がある場合は、「一番最初のレス」でいいと思う。
人によっては「終了時のレスを維持」する設定になっていて、勝手に該当スレまでジャンプして欲しくないという人もいるかもないで
他の人の反応を見て決めてもらって構わない。
前にも言ったが催促じゃねぇけど、余裕があるときで構わないのでよろしく頼む。 >>368
>>377のほうは「DAT HTML ブラウザ 外部ブラウザ」となっていることの「外部ブラウザ」のことだったんだが、
こっちは今の仕様のスレURLのみでいいかもしれない。
で、検索結果のレス表示の横、今は「▲> 」って表示のところに「外部ブラウザ」のリンク(記号でいいので)を表示するのでもいいな。
それをクリックすると外部ブラウザにレス番つきでURLを送るようになる感じ。
こっちなら嫌がる人はいないと思うし。
それともうひとつあるんだが。
レス表示横の「>」って記号をクリックすると、「検索結果」タブの横に「HTML」タブが表示されて該当のスレが表示されるんだが、
そのときに、そのレス番までジャンプして表示するようにはできないだろうか。
わがままな要望だがよろしく頼む。 > ・専用ブラウザでスレッドを開けるようにしました。
GJ!!
某ソフトを逆コンパイルして、参考ルーチンを書き込んだりしたかいがあったw ダウンロードありがとうございます。
>>370>>371
式をありがとうです。
基礎BE番号が一致するものだと、同じ人ということですか。
>>373
>>375さんの通りです。
少し説明が足りていませんでした。
>>377>>378
要望をどうもです。
下画面のレスからも外部ブラウザが見れたら便利かもですね。
あと、2つ目の「>」は既にレス番にジャンプしますが、ならないですか。
>>381
>基礎BE番号が一致するものだと、同じ人ということですか。
基礎BE番号が同じなら同じ人です。 >>381
どうも。
>>377-378です。
Verは2.031を使用しています。
>あと、2つ目の「>」は既にレス番にジャンプしますが、ならないですか。
飛ばないです。
で sita.html の内容を見てみたんですが
「>」のリンクが下のようになっています。
# 行が長いので途中で改行を入れています。
# また「G:\Program Files\Jane Style\Logs」は自分の環境でのJaneStyleのログフォルダです。
<a href="ue.html#0" target="ue"><font size=2>▲</font></a><font size=2>
<a href="G:\Program Files\Jane Style\Logs\2ch\PC等\ソフトウェア\1204107839.dat.html-menu:172">
このdat.htmlの後ろは#でないといけないと思うんだけど、-になっているのが原因かなと思います。 ></a>付け忘れた。
<a href="ue.html#0" target="ue"><font size=2>▲</font></a><font size=2>
<a href="G:\Program Files\Jane Style\Logs\2ch\PC等\ソフトウェア\1204107839.dat.html-menu:172">></a>
「>」のリンクがおかしくなっていると思う
これって自分だけなのか? >>382
ありがとうございます。
わかりました。
>>383-384
レスありがとうございます。
リンク先が「〜\1204107839.dat.html-menu:172」になるのは正常です。
プログラム内で、「\\html.html#menu:172」に変換して
「\\html.html#menu:172」を開きます。
プログラムで、"172"が読めてないか、htmlが正しく作れてないか、
作ったhtmlを正しく呼び出せてないかと思います。
どのスレッドでもそんな感じですか。 >>385
どうも。
>プログラム内で、「\\html.html#menu:172」に変換して
自分が確認したのはフォルダ内に作成されるsita.htmlじゃなくて、
threadsearch上の検索結果タブで「右クリック→ソースを表示」をしたんだけど。
リンク判定に失敗して、- → # 変換がされてないものが表示されちゃっているって感じなのだろうか。
>どのスレッドでもそんな感じですか。
そんな感じ。
ちょっと入れなおしてみるっす。 JaneStyleのコマンドで選択範囲をスレッド全文検索を使って検索みたいにするにはどうしたらいいのでしょうか? >>386
レスへ飛ばす方法をプログラムで変える方が良さそうですね
NPlusViewで使用している方法がうまく行きそうな気がします。
確かjavascriptで飛ばす方法だったと思います。
>>387
すみませんが、今のバージョンではできません 俺は35歳だけど20歳のおっぱい大きくて可愛い子
とつきあってるんだぜうらやましいだろう? 俺は35歳だけど20歳のおっぱい大きくて可愛い
彼女がいるんだぜうらやましいだろう? 人
(__) ウンコー
(__) (´⌒(´⌒
(・∀・ ) (´⌒(´≡
O┬O ノ` ≡≡≡(´⌒;;;
◎┴し-◎ (´⌒(´⌒;; 検索ですが、and検索だけでなく、or検索がしたいのですが
出来ないでしょうか? 正規表現が欲しい
あと外部ブラウザで開くとき、URLにレス番号を付加して >>397-398
どうもです
そういえばOR検索がありませんでしたね。
外部ブラウザの要望が沢山あるとは、ちょっと意外。 DLLだけ作ればいいようにDLLの仕様公開してクレオ このソフトはなんかすぐ済むはずのファイルリスト取得が
時間食うんだけどどうなってるの?
自分だったらもっと速いっていう自信あるけど、GUIから作る気はない。 DLLのインターフェースの公開は、Janeにも組み込まれる可能性あるよ。 >>400>>401>>402
すみませんが、DLLの仕様などは公開するようなことは、
今のところ無いですね。
組み込み出来るようにする予定もないです。
ファイルリスト取得は「ファイルリスト取得」としか書いていませんが、
実際にはファイルの中身のチェックをして、
2chのログかを判定しています。
そのために、リストを作るのに時間がかかっています。 それと、スレッド全文検索を更新しました。
Ver 2.04になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・HTML化した時に、任意のレス番号までジャンプできない場合がある不具合を修正しました。
・スレにあるBE2chの"キー"を使い、BE2chのユーザーを検索できるようにしました。
・専用ブラウザでスレッドを開くときに、検索結果のレスごとにジャンプできるようにしました。
・OR検索をできるようにしました。 OR検索について、「含む(OR)」は理屈的に考えてインデックスを検索に使えますが、
DLLを更新していないので今のところインデックスを使えません。
DLLの修正が思ったより大変そうだったので。
また、気が向いたらその部分を作りたいです。 キタ━━━━━━(゚∀゚)━━━━━━ !!!!! >>378だけど。
> クリックでHTML上のレスにジャンプできることを確認しました。
それと□クリックで正常に連携できることを確認しました。
乙ですー >>402
JaneViewつかってみインデックス(外部ソフト依存だが)検索付いてるから
こんばんは
>>409
一応BEの番号で検索できます こんばんわー
ところで要望なんだけど、インデックス使用した検索は指定した板で検索できるわけだけど
これを特定のカテゴリとか、複数の板(任意選択)のようなことは無理でしょうか。
JaneStyleのログ検索のように検索したい板(もしくはカテゴリ)をリスト形式で追加していく感じで。 >>411
要望どうもです。
今は1板のみ選択できますが、複数はできません。
板をいくつか選べるようにも出来ると、便利かもしれないですね。 >>414
100% です。
全文をインデックス化するので、インデックス化されていれば、
検索語句を100%抽出します。
ユニークな語句だとかなり高速に検索できます。 janestyleなんですけど
したらばとかその他の板にも対応できような措置をとってもらえるとうれしいです ttp://azlucky.s25.xrea.com/2chboard/bbsmenu2.html
ボートデータ取得できません >>416
ユーザーです。横はいり失礼。
Janestyleとしたらばの組み合わせは対応できていますよ? どうもです。
>>416
しらたばは、datなどが2ch互換ですか?
見ないので分かってないです。
すみませんが2ch互換の掲示板しか使えないのです。 >>417
HTMLタグが少し違うので、そのままでは使えないです。
とりあえず、下をすれば使えます。
@bbsmenuをダウンロードして、「bbsmenu.html」の名前で保存
Aテキストエディタで開いて文字の置換をする
「<BR><B>」→「<BR><BR><B>」
Bthreadsearchのフォルダにbbsmenuを置く
Cthreadsearchを起動する >>420
自分は>>416じゃないですけど、したらばは2ちゃんねる互換ですよ
bbsmenu.htmlには存在しないので利用できないよという意味ではないでしょうか。
手動でbbsmenu.htmlにしたらばを登録すると「板 -カテゴリ、板」のコンボボックスには表示されるがうまく検索できなかった(インデックス検索)。
(まぁちゃんと記述してなかっただけだと思うけど)
インデックス無効だとちゃんと検索されたのを確認。
ちなみにWEBディレクトリ構成は
http://jbbs.livedoor.jp/bbs/read.cgi/computer/10298/1188963926/
のようになっていて、専ブラ側のjane2ch.brdは
jbbs.livedoor.jp/computer[TAB]10298[TAB]したらば助け合い掲示板
という感じで サーバ名 jbbs.livedoor.jp/computer 、板名 10298 としている。
ローカル側のディレクトリツリーは2ちゃんねるの場合と同じ。 >cen ◆Am9xOgNMYEさんへ
したらば対応をソフト側で処理するのは難しいと思う。
で、たとえば設定で専ブラが持つjane2ch.brdを読みに行くというのはどうでしょうか。
つまり、外部ボード(このソフトから見た外部という意味で、専ブラのjane2ch.brd)を指定できるようにする。
この指定があるときは独自にダウンロードした(する)bbsmenu.htmlは使わない。
こうすれば、外部ブラウザに設定している専ブラと外部ボードに設定している専ブラ、検索フォルダに設定している専ブラ(のログフォルダ)が同じであれば
何の苦もなくカテゴリや板名を取得できるし、問題なくインデックス生成や検索ができて楽じゃないかなと思う。
という案はどうでしょうか。 >>423-424
レスありがとうございます。
2ちゃんねる互換ですか。
先程、次の環境で動きを見てみました。
-----------------------------------------------------------------------------
・ブラウザ
・JaneStyleを使用
・スレッドを閲覧してdatを取得
http://jbbs.livedoor.jp/bbs/read.cgi/computer/10298/1188963926/
・スレッド全文検索
・ボードデータをダウンロード
・検索フォルダにJaneStyleを選択
・bbsmenu.htmlの適当なカテゴリ(地震)に
「<A HREF=http://xxxx.xxx.xxx/xxxxxxxx/>【したらば】コンピュータ</A>」を追加して
スレッド全文検索を再起動
・インデックスを作成
-----------------------------------------------------------------------------
インデックスを作成することができ、板を選択した時の検索もできました。
bbsmenuにうまく登録すれば、したらばでも検索できますね。
方法は>>424のように専用ブラウザの板リストを使うことが考えられますが、
専用ブラウザに特化した方法でなく、なるべく多くのブラウザで使えそうな
方法でしたいと思ってます。
(今はログフォルダ名にアドレスか板名があれば、選択した板のフォルダと認識します。
たとえば、"【したらば】コンピュータ"など)
bbsmenuに無いものは個別で登録とかの方法かなと思ってます。
個別登録と専用ブラウザのbrdが読めれば、いいのかもしれませんが。 連携しているユーザに関しては、データの同期が容易に出来るので一考願いたいです>>424
もちろん「なるべく多くのブラウザで使えそうな方法」を優先していただいて構いませんので。 cenさんへ
「レスをクリップボードにコピーする」機能を追加してほしいです。
検索終了後、検索結果タブの下窓にて、レス番号を左クリックすると、
レスの内容が、すでにクリップボードにコピーされている。という機能です。
ただし、人によってコピーしたい内容が異なると思いますので、
下窓のレス番号を右クリックしたり、詳細設定タブに移動したりすると、
・レスの内容をコピーする
・レスのURLをコピーする
・レスのタイトルとURLをコピーする
・レスのタイトルとURLと内容をコピーする
という選択肢があったら良いなと思うのです。
実際、そんな事ができるかどうか 分からないのですが、
「レスをクリップボードにコピーする」機能、よろしくお願いします。 Ver 1.80までは正常に動作しますが、1.81以降のものが使えませんでした。
このアプリケーションの構成が正しくないため、アプリケーションを開始できませんでした。
アプリケーションを再度インストールすることにより問題が解決する場合があります。
XPで.NET Framework 2.0は入ってます。
他に必要なものあります? >>431
ダウンロードありがとうございます。
.NET Frameworkが正しく入っていないかもしれないので、
下をしてみてください。
また、ソフトをインストールしたフォルダを変えてみてください。
@.NET Frameworkのバージョンを確認
ファイル名を指定して実行で「%systemroot%\Microsoft.NET\Framework」へ移動
「v2.0.50727」を確認
http://msdn.microsoft.com/ja-jp/kb/kb00318785.aspx
AMicrosoft .NET Framework Version 2.0 再頒布可能パッケージ をインストール
http://www.microsoft.com/downloads/details.aspx?FamilyID=0856eacb-4362-4b0d-8edd-aab15c5e04f5&displayLang=ja
http://www.microsoft.com/downloads/det >>432
XPのSP適用が必要なんですね。
どうもすみませんでした。 こんにちは
スレッド全文検索を更新しました。
Ver 2.05になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
マイボードの機能を追加しました
2ch以外のボードデータを一部取得できるようにしました
検索語句の履歴機能を追加しました。 上だと邪魔というか非表示に設定とかできますか
あとフォントとか背景色の指定できたらいいなとか思いました >>439
大抵の場合、
「設定タブ」で検索内容を設定。内容を見直し検索ボタン、
時間を置かずに「検索結果タブ」に移動するので、
「検索条件の表」を見なくても問題ないです。
ただし、
時間が経過して、結果を保存したHTMLを見る時、「検索条件の表」は必要と思います。
ちょっと頭に浮かんだのは、上窓の最初の一行目が下記のようになる感じ。
検索日時:**年*月*日 *時*分*秒 検索条件の詳細 ← ココをクリックすると、「検索条件の表」に移動する。
 ̄ ̄ ̄ ̄ ̄ ̄ ̄
※検索条件の表の場所は、cenさんが決める。
実際どうなるのかは分かりませんので、次回以降の更新を楽しみにします。 >>440-441
どうもです。
「検索条件の表」は必要ですが、いつも見えてなくても
よさそうですね ワールドカップ開催したら、客はランドに交換するから安値のうちに買ったほうがいいかな?
どうも
スレッド全文検索を更新しました。
Ver 2.06になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
検索語句の履歴表示の横幅が変動しない不具合を修正しました。
検索条件の表示/非表示を切り替えられるようにしました。 >>446
おつかれさまです
検索条件の表示/非表示は便利ですね
したらば等は>>425,436で対応したということでしょうか?
一応書いてあるとおりにやったら検索できたようですけど
設定にあるマイボードの項目を開くと、閉じた時に
検索条件に指定してあった板がリセットされますがこれは仕様?
再設定するのは不可能ではないでしょうけど、
リストを作成しなおす可能性があるから面倒でしょうか。
【要望】
・検索ボタンにショートカットが欲しい
・条件の板を複数指定したい
たとえばゲームをやっていると、大規模&質問&ネヲチなどから
まとめて検索したいと思うことがよくあります。
今は一つずつ指定して検索しなおすか、あきらめて条件をはずし、しばらく検索放置
・下部のプログレスバーですが、全体の進捗も出してもらいたい
といっても難しいですよね。大体の目安とかでもいいんですけど。
対象の板の数とか、dat数とか。
板の条件を指定していないときにdat数だとそれ自体がパフォーマンスに影響しそうですけど。
板数、板ごとのdat数、dat内?みたいに並べたらくどいですかね。
ちなみに今って何が表示されているのでしょう?
読み込んだByte数などを一定量カウント?
・マイボードを追加する画面で、追加されたリストをダブルクリックしたら
右側の板名、アドレスのところに表示して欲しい
使用頻度は少ないと思いますけど、修正するときに便利かと。 >>447
どうもです。
したらば等の他の掲示板はマイボードで一応、
使えるようになったと思っています。
マイボードを編集したら、板のリストを読み直すのでリセットします。
再設定はできると思いますが、あまり頻繁にマイボードを設定しないと
思ったので、再設定までは作っていませんでした。
要望をどうもです。
複数板の希望が多いですね。
あと、プログレスバーは単に一定時間で動いています。
全体の目安があると便利かもですね。
確かにマイボードで設定した内容が全部みえると良さそうですね。
突然ですが、どなたか東伸エンジニアリングって会社の情報ご存知ないですか? 検索結果をV2Cという専ブラにぶち込んでスレ一覧の形式みたいに表示することができますか? こんばんは
スレッド全文検索を更新しました。
Ver 2.07になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・マイボードの修正をできるようにしました。
・初期設定の画面を追加しました。
複数板の選択は難しかったので、今回はすみませんが
見送りました。 昨日追加した初期設定に不具合があったので修正しました。
すみません。
スレッド全文検索を更新しました。
Ver 2.071になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・ 初期設定後にbbsmenuが正しく読み込めない不具合を修正しました。 横道の話ですが、サイトの専用スレッドのURLがpc12のままだね
過去ログ倉庫に飛ばされたのでちょっとびっくりしたw どうもです。
全然気がつかなかったです。
直しました。
こんにちは。前にものすごくインデックス更新に時間がかかると言っていたものですが、
USB外付けのHDDをSATAに変えたところ、劇的に更新が早くなりました。
スレッド数は20万スレッドくらいでしたが、更新が数分で終わるようになりました。
単純なことで改善できてびっくりです。
ところで、インデックスの更新を自動化するためのコマンドラインのスイッチはないものでしょうか?
例えばタスクマネージャで指定しておいて、毎日更新することができるようにできれば、と思った次第です。
・起動しているものとは別プロセスで起動して更新処理
・インデックスを更新して自動的に終了(起動中ならそのままのプロセスで更新)
のようなどれか何かオプションがあればよいのですが。 こんばんは
スレッド全文検索を更新しました。
Ver 2.08になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
検索語句の削除でテキストボックス内の語句も消去するようにしました。
OS起動時にインデックスを自動更新できるようにしました。
>>460
どうもです
自動更新がないので作ってみました。
threadsearch_indexupdate.exeを起動すればインデックスを更新します。
あと、threadsearch_indexupdate.exeは
起動すると通知領域のみに現れます。
インデックスを更新すると自動終了します。
マウスをかざすと更新状況を表示します。
>>461
すごい。自動更新できるようになりました!
どうもです。
>>464
インデックスを作るときに小文字と大文字を別ものとして登録しているので、
それは無理です。
別々に登録することで高速に検索できるようにしています。 >>465
ああっ
ちょっと使ってみてどうも検索漏れがかなりでると思ったらそのせいだったんですね
なるほど、このソフトはcase sensitiveな仕様なんですね。
Google検索やデスクトップ検索のようなインデックス型の検索のつもりで使っていて面食らいましたw
WEBの検索エンジンのデフォルトのように曖昧に検索する方法があったらいいのかもしれませんね。
インデックス型なら、インデックス作るときに内部で小文字か大文字に統一して、
ユーザーが検索クエリーだすときも、内部で統一して検索するのかな、やっぱり どうも
スレッド全文検索を更新しました。
Ver 2.09になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・ユーザインターフェースを変更しました。
こんな感じです。
http://www.geocities.jp/cen_hp/threadsearch180/threadsearch209top.PNG
>>466
なるほどそうですね。
「thread」と「Thread」などが一緒に出てくれば便利そうですね。
インデックスを作るときに、大文字と小文字を一緒にすればできそうです。
>>467
>>411もいつかはお願いします。
複数の板じゃなくても特定カテゴリだけでもあればうれしいです。 どうも。
スレッド全文検索を更新しました。
Ver 2.10になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・検索設定で複数板を選択できるようにしました。
>>468
とりあえず、今回は板を選べるようにしてみました。
結構手間がかかるかと思ってましたが、そんなにはという感じでした。
>>469
ありがとうですー
複数板の検索とっても便利です。
ところで要望なのですが。
起動時に「本文以外の検索項目が設定されています。検索オプションをクリックすると内容を確認できます。」ってメッセージが出ますね。
これを抑止するか、最初から検索オプションを開いた状態で起動(という設定を追加)することはできませんか?
本文以外で検索することも多く、起動時に毎回出てくるメッセージボックスが煩わしく・・・。
それと本文が空でもデフォルトで本文にチェックがついているため、本文検索でない場合都度クリックして無効にする必要があります。
本文が空白で有効だと怒られてしまいますよね。
空白だった場合にはデフォルトで無効にしておくようにできませんか?
あと、first.txtというファイルにより新規設定画面が出る仕様だと思うのですが「既存の設定を引き継ぐ」という選択肢を追加できませんでしょうか?
もしくは、設定画面を開くけど、既存の設定の状態を反映させた形で開くようにするとか。
展開後フォルダを丸コピーするとfirst.txtもコピーされますし、その状態で起動させると検索フォルダもリセットされインデックスも作成済みなのに未作成と表示されてしまいます。
(インデックスは実際には利用できるので問題ではありませんが)
first.txtをコピーしなければいいということでしたら・・・これからそうします。。。
(前回の更新時のときは設定が全部消えたのかと思いました。)
よろしくお願いします。 >>469
汎用的なgrepだと絞り込み(スレタイなどで)ができないし
こういうソフトがないなかーと思ってたので助かります
丁寧な作りでとても使いやすいです
ありがとう 期待してたけど微妙に使いにくいまま更新止まっちゃってんのな
入力欄Enterキーで検索開始してくれないし
検索完了しました、の後に自分でタブ移動しなきゃいけないし
他の人も言ってるけど、起動時に
「本文以外の検索項目が設定されています」
がポップアップするのは煩わしいし
履歴項目の削除はメニューからだと項目別消去出来ずに全消去しか出来ないし
板選択も単なる羅列じゃ探しにくいからカテゴリ毎に格納しといて欲しいし
検索結果から更に条件で抽出が再検索かけないと出来ないし 入力欄Enterで検索開始できるようになればありがたいです この頃忙しいので、こういうのに手が回ってませんね。
>>476>>478
なるほどです。
具体的に書いてもらって分かりやすいです。
「本文以外の検索項目が〜」があるのは、後日使った時に、
本文以外の条件を設定したのを自分が忘れるからです。 >>471
first.txt のとことは、ご指摘の通りの動作です。
設定を引き継ぐ部分は面倒だったので作ってません。
設定があれば新規設定画面を飛ばすのもいいかなと思ったり。 検索エンジンの開発と、GUIの開発をわけるとか
検索エンジンは誰にでも簡単に作れるわけでもないと思うから
APIを公開して使えるようにすれば
画面の部分は作ってくれる人がいるんじゃないかな
たぶんだけどw
http://www1.axfc.net/uploader/Sc/so/237192.zip
threadsearch上のShiftとエンター同時押しで検索するAHKスクリプトです
本当はEnterだけで検索したかったんですが色々と問題があったのでShiftも加えました
デフォルトはShiftですがスクリプト中の"+Enter"の+を!に変えるとAlt ^に変えるとCtrlになります
問題が有りましたら消します >>482のスクリプトはVer 2.10用です
Ver 2.08で使うと関係ない場所にチェックが入るのでスクリプトを開いて以下の行を削除してください
ControlClick,WindowsForms10.BUTTON.app.0.378734a2,スレッド全文検索,,,,,;設定画面 >>481
ローカルにdat全文検索サーバーを起動しておいて、その他ブラウザやWindows用のGUIをつくるわけか
今でもthreadsearch.iniで検索クエリーを指定してコマンドラインで検索結果を出せるし、
ThreadSearchをそのまま利用してブラウザでhtmlを開けば擬似的にできるかもね
どうも。
スレッド全文検索を更新しました。
Ver 2.11になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・本文が空白だった場合には、検索オプションの画面で、本文検索のチェックを無効にするようにしました。
・入力欄Enterで検索開始できるようにしました。
・起動時、本文以外の検索項目がある場合に「本文以外の検索項目が設定されています」のポップアップを出すかを選べるようにしました。
・起動時にソフトウェアのアップデートをチェックするようにしました。
・バージョンアップなどで設定ファイルが既にある場合は、初期設定画面が出ないようにしました。
>>482-483
わざわざありあとうございます。
結構要望がありそうだと思いました。
>>484
なるほどです。
そういう使い方の発想はありませんでした。
>>481
作り方として検索エンジン?の部分とGUI部分が混ざっているので
だいぶ難しいかもですね ---------------------------
updatechk.exe - .NET Framework の初期化エラー
---------------------------
このアプリケーションを実行するには、最初に以下の .NET Framework バージョンのいずれかをインストールする必要があります。
v4.0.30319
.NET Framework の適切なバージョンの取得方法に関しては、アプリケーション発行者に問い合わせてください。
---------------------------
OK
--------------------------- >>487-488
ご指摘ありがとうございます。
「updatechk.exe」が.NET2.0制限になっていない不具合を修正しました。
スレッド全文検索を更新しました。
Ver 2.12になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
どうも。
スレッド全文検索を更新しました。
Ver 2.13になりました。
http://www.geocities.jp/cen_hp/threadsearch.html
更新点になります
・アップデート確認プログラムを修正しました。
・インデックス検索時に進捗(検索したスレッド数/検索する必要のあるスレッド数)を
表示するようにしました。 高性能な検索順位チェックツールが今なら無料です。
http://www.kensaku-giken.com/2/904-2.htm
PCのYahoo!・Google・MSNの順位・インデックス数・被リンク数チェック
携帯のYahoo!モバイル・Googleモバイル・gooモバイルの順位・インデックス数・被リンク数チェック、
ライバルサイトのインデックス数・被リンク数のチェックなどができます。
毎日1回起動して、【検索】ボタンを押すだけで、
数百サイトの順位チェックを自動で行い、過去の検索結果も記録して残します。
SEO対策の検証に不可欠な順位・インデックス数・被リンク数の変動をチェックすることができます。
市販されている順位チェックツールは1万円以上するものばかりですが、
そのようなツールよりも高機能なのに無料です。
利用制限なども一切ありません。
PC&モバイル対応の検索順位チェックツールです。
最近このソフトの存在を知り使わせていただいたのですが、なかなか便利そうですね。
1つ要望を。
検索結果にしたらば等の外部板のレスがある時、ポップアップ内で改行がされない
(そもそも<br>タグ自体が出力されない)ようなので、修正してもらえると嬉しいです。
恐らく、2ちゃんねるのdatファイルでは「 <br> 」とタグの前後に半角スペースが入っているのが、
外部板のそれだとスペースなしの「<br>」なので、判定に失敗しているのだと思います。たぶん。 >>501
どうも。
2chに合わせたので、「<br>」前後のスペースを含めて判定してます。
他の掲示板は気にしてなかったです。
あと、Windows8 -ConsumerPreview- (64bit)で動かしてみました。
普通にいけますね。 logが4Gくらいあるせいか結構インデックスの作成に時間かかるんだけど
差分だけ更新は出来ないの? ↑普通にインデックス作り直してたみたいで、更新にしたらちゃんと出来ましたごめんなさい Twitter始めました
HPのTOPにウインドウを追加。
どうでもいいことや、ソフトについて何かあればつぶやきます。
https://twitter.com/intent/user?screen_name=t_cen
indexフォルダが大きいのでプログラムと別のところに移したいのですが
設定で場所を変えられるようにしていただけませんか >>512
遅レスですが
それはいろいろ変えないといけなくて、大変なのでしないかもです >>513
自分でも書き込んだの忘れてましたが(笑)レスあざす
了解しました 板選択ができないっす。
Win7Pro-64Bit
32ビット版やXP64Bitではなにも問題なく検索できているのですが。
なんか設定がエラーっぽいんですけど、
すべて設定削除したい場合ってフォルダ丸ごと削除して最新版解凍したものと置き換えの他に
何をやればいいでしょうか。
最新版に置き換えても検索オプション→板選択→カテゴリ:ニュースを選ぼうとしても
チェックボックスにチェックが入らないです。 index作成するためにdat読み込むから、p2p共有ファイルじゃ無理だろう
indexファイルも共有して相互検索できるようになったらおもしろいけど ■ このスレッドは過去ログ倉庫に格納されています