2ちゃんねるスレッド全文検索・・・ThreadSearch

■ このスレッドは過去ログ倉庫に格納されています
2008/02/27(水) 19:23:59ID:LnN9ZP+r0
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな
2008/02/27(水) 19:27:53ID:1hEn6hQc0
Styleの作者ならパクってくれると信じてる
2008/02/27(水) 19:37:05ID:vjWd7/tI0
取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック!
2008/02/27(水) 19:38:24ID:1hEn6hQc0
よく見たらどの2chブラウザでもいいっぽいのかこれは
2008/02/27(水) 20:35:08ID:FQ2KAFmK0
cenのソフトか
本人もいることだし、ここでいいでしょ
MonoView Part1
http://pc11.2ch.net/test/read.cgi/software/1120578352/l50
2008/02/27(水) 21:39:02ID:i+WKuLeL0
JaneNidaの検索部分を抜き出したようなソフトだ
2008/02/27(水) 21:43:09ID:XGGqQQsX0
おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。

>>4
datファイルのあるフォルダならブラウザは何でもいいです。
8名無しさん@お腹いっぱい。
垢版 |
2008/02/28(木) 10:42:47ID:uqwne/o50
>>5
あきらかに趣旨が違うから、ここでもいい気が。
2008/02/28(木) 12:52:16ID:uqwne/o50
これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。
2008/02/28(木) 17:20:43ID:Gggq9Nyh0
地味に便利な予感
11名無しさん@お腹いっぱい。
垢版 |
2008/02/28(木) 23:44:23ID:L0/jQ3rB0
>>9
>htmlに吐き出す
できたぞ
2008/03/06(木) 16:17:15ID:HcKfrMgv0
“2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
http://namidame.2ch.net/test/read.cgi/news/1204783364/

ボロクソ言われてんぞ
2008/03/07(金) 00:33:43ID:PGe1vwef0
>>12
どうもです
携帯で見てみましたが、.NET重いとか遅いとかありますね。
まあ確かにそうです。

こっちに記事がでてますね。
http://www.forest.impress.co.jp/article/2008/03/06/threadzenbun.html
2008/03/07(金) 00:48:15ID:zd9RAkN10
まあ、2chブラウザ自体に検索機能あるしね
2008/03/07(金) 17:38:16ID:87XM4sqy0
誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな
16名無しさん@お腹いっぱい。
垢版 |
2008/03/07(金) 18:20:03ID:87XM4sqy0
言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。
2008/03/08(土) 03:15:59ID:kKmHjYKD0
専ブラのボードデータ読んで欲しいものだ
2008/03/08(土) 11:46:41ID:762Hpsy80
似たようなソフトが二つあるけど、その違いは?
2008/03/08(土) 11:47:04ID:D+lEa7FU0
>>18
もう一つは?
2008/03/08(土) 16:19:56ID:762Hpsy80
スレッド全文検索
http://www.geocities.jp/cen_hp/threadsearch.html

datファイル全文検索ソフト
http://www.geocities.jp/cen_hp/program2.html
2008/03/08(土) 17:24:55ID:TYy/Hfz20
Googleデスクトップでdatが検索できればいいんだけどなぁ
2008/03/08(土) 23:36:26ID:D+lEa7FU0
>>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって
23名無しさん@お腹いっぱい。
垢版 |
2008/03/12(水) 22:39:18ID:GO9/GYs2O
age
24名無しさん@お腹いっぱい。
垢版 |
2008/03/18(火) 16:58:40ID:mxy1kdrV0
板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。
2008/03/23(日) 05:48:21ID:t1CKTA7y0
>>21
使えるかは知らんが

Jane Log Indexer
ttp://www.geocities.jp/hiko_bae/janelogindexer.html
2008/03/23(日) 12:44:05ID:hbPh49eZ0
>>25
おおー、これはすばらしい!

ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど
2008/03/23(日) 19:28:22ID:qVTFsXtE0
バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。

思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。
2008/03/23(日) 19:49:45ID:qVTFsXtE0
あっ、バッチじゃダメか…(^^;
2008/03/23(日) 19:56:23ID:qVTFsXtE0
レジストリか…さじ投げする。
すまない。NGしてくれい。
2008/03/23(日) 22:39:39ID:Q/s+q/fC0
index作成型じゃないの?
すごくのろい。
2008/03/23(日) 23:42:41ID:Oti8oodi0
>>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。

日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。
2008/03/23(日) 23:44:03ID:Oti8oodi0
>>25
へえ。こういうのあるんですね。

>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。
2008/03/24(月) 16:48:56ID:DoGMgzst0
>32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。
2008/03/26(水) 00:32:25ID:oQdgbeGv0
NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。
35名無しさん@お腹いっぱい。
垢版 |
2008/03/26(水) 10:35:29ID:kUpi6chJ0
そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。

この機能は凄いありがたいんでどうにか高速化して欲しい
36名無しさん@お腹いっぱい。
垢版 |
2008/03/31(月) 04:45:41ID:ERjlVa+T0
これ結構便利だ
2008/04/01(火) 22:43:05ID:h0Fp9KJ00
cenさんありがとう、これ物凄い便利です

要望ってここで書いちゃっていいのかな?

追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと

最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。

御一考頂ければなぁ、と思います
2008/04/03(木) 00:51:35ID:Cv07eAXJ0
>>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。
2008/04/03(木) 00:53:32ID:Cv07eAXJ0
>>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね
2008/04/03(木) 02:36:58ID:EcJnLzvJ0
>>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ
41名無しさん@お腹いっぱい。
垢版 |
2008/04/08(火) 17:41:43ID:drLz8VQs0
期待age
2008/04/11(金) 01:39:36ID:ECxOlQdf0
index作成型 期待

ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。

まあindex作成型なら板指定なんかする必要は無いとも思いますが。
2008/04/11(金) 09:45:28ID:5aXvEh9K0
index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。
2008/04/20(日) 23:26:55ID:qLPJ64JY0
>>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。

>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。
2008/04/24(木) 14:17:31ID:3g3UPg6D0
>インデックス方式
楽しみーに待ってるです
2008/04/26(土) 17:16:31ID:nKn/rH3TO
あげ
2008/04/27(日) 09:23:11ID:9Z0yo3eP0
インデックスは独自?
それともnamazuとか使うの?
2008/04/27(日) 22:42:01ID:bblsSfITO
>>47
独自の方法でする予定です。
49cen ◆Am9xOgNMYE
垢版 |
2008/05/04(日) 06:42:57ID:BcpREFdy0
おはようございます。

スレッド全文検索を更新しました。
Ver 1.50になりました。
http://www.geocities.jp/cen_hp

更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。
2008/05/04(日) 06:49:10ID:BcpREFdy0
インデックスを使うことで高速に検索できるようになりました。
http://www.geocities.jp/cen_hp/threadsearch.html#7

HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。
2008/05/04(日) 07:01:09ID:BcpREFdy0
それから、検索結果はVer1.00と同様の結果が出ます。
2008/05/04(日) 18:32:08ID:IdG+Z9YvO
あと、方法は独自と書きましたがほぼngram法です。
2008/05/04(日) 19:57:44ID:qNt4WyLm0
Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに

「インデックス作成中・・・ファイルリスト作成中」

と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・
2008/05/04(日) 21:21:24ID:XlfbduW40
>>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。

一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt 〜 index_xx.txt(xxは数字)
・path.txt
2008/05/04(日) 22:35:21ID:XlfbduW40
>>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。
56名無しさん@お腹いっぱい。
垢版 |
2008/05/05(月) 02:14:03ID:a0XSAmtH0
>>50
キタ━━━━━━(゚∀゚)━━━━━━ !!!!
とても乙です!

うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)

検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です
2008/05/05(月) 13:50:16ID:ywlZf+w20
>>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。
5857
垢版 |
2008/05/05(月) 14:37:31ID:ywlZf+w20
>>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。
2008/05/05(月) 23:34:43ID:VS3MMtD80
>>55
あと、ウインドウ・サイズも覚えておいて欲しい。

.NET Framework ソフトとしては軽いので結構期待してる。
2008/05/06(火) 00:22:40ID:bFXI3am60
うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。

祭日中にとっても乙
2008/05/06(火) 00:25:19ID:YR0md6ke0
>>60
>不完全ぽい
kwsk
2008/05/06(火) 01:24:52ID:9EHtnBj90
>>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl.
2008/05/06(火) 23:28:52ID:4jhZlQJu0
index作成開始2時間半後で45%
まだまだ先は長いな。
2008/05/07(水) 00:23:43ID:ses9irbr0
使って頂いてありがとうです。

>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。

>>59
それもいいかもしれないですね。

>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。
2008/05/07(水) 02:01:18ID:/tgmzZhu0
5万1千程のdatで4時間半かかった。
2008/05/07(水) 23:27:54ID:RBk6c+cP0
初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。

indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか?
2008/05/07(水) 23:37:48ID:ses9irbr0
>>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。
2008/05/07(水) 23:48:26ID:kAifuv6Y0
乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。

もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です
6966
垢版 |
2008/05/08(木) 00:23:43ID:eGa6VFwL0
>67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-)
7058
垢版 |
2008/05/08(木) 13:38:01ID:CHC9JFTU0
>>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。
71名無しさん@お腹いっぱい。
垢版 |
2008/05/08(木) 21:44:59ID:oX3p46BtO
>>68
設定読み込みで、iniファイルを選べるからそれでしてみたら?
2008/05/08(木) 23:26:19ID:fy9YvlJe0
どうもありがとうです

>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。

>>70
そういう方法もあるとは
2008/05/08(木) 23:32:00ID:fy9YvlJe0
あと、窓の杜で記事が掲載されました。
http://www.forest.impress.co.jp/article/2008/05/08/threadzenbun150.html
2008/05/09(金) 00:14:47ID:54C7YKST0
>>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます

>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。

>>73
窓の杜も細かく拾いますねw
2008/05/09(金) 23:17:30ID:9tPKF/2D0
俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな
2008/05/09(金) 23:39:32ID:9tPKF/2D0
ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか
2008/05/11(日) 01:14:04ID:rI+U6KpG0
.NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが
2008/05/11(日) 02:16:35ID:PFNSvUPe0
VCは.NETに比べて手間が10倍くらいに増えるからな。

起動速度だけのためにそんな手間はかけてられないって感じじゃね?
2008/05/11(日) 18:51:41ID:gQon1txW0
8.4ギガ程のログで3ギガ程のindexが出来ますた。
2008/05/11(日) 19:14:25ID:Znmvmy7U0
DesktopHE
ttp://freemind.s57.xrea.com/desktophe/index.html
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか
2008/05/18(日) 23:15:54ID:+yfWcw6T0
>>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。

>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。

>>80
そういうのもあるんですか。
ちょっと見てみます。
82名無しさん@お腹いっぱい。
垢版 |
2008/05/23(金) 20:17:03ID:UH4K7XDzO
age
83名無しさん@お腹いっぱい。
垢版 |
2008/06/01(日) 14:35:57ID:iGifQDnZ0
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   index追加型、急かしてないよ?        
 と__)__) +
84名無しさん@お腹いっぱい。
垢版 |
2008/06/01(日) 23:46:08ID:63eV6hEF0
急がせてるwwwwwwwwwwww
85名無しさん@お腹いっぱい。
垢版 |
2008/06/02(月) 22:00:16ID:xloWUVFk0
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   急かしてないよ、ホントだよ?        
 と__)__) +
2008/06/03(火) 14:01:04ID:5GdvKxzv0
Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
ttp://www.oshiete-kun.net/archives/2008/05/janedat.html
Datファイル全文検索ソフト DatE
ttp://frozenlib.net/DatE/

こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ
2008/06/03(火) 14:31:24ID:i98vc4zJ0
Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い
2008/06/03(火) 20:13:08ID:NItC+Ua+0
ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ
89名無しさん@お腹いっぱい。
垢版 |
2008/06/07(土) 15:31:32ID:6OP9T2Vu0
週末きたけどそろそろバージョンくる?
90名無しさん@お腹いっぱい。
垢版 |
2008/06/13(金) 22:02:47ID:+0Vv0YEo0
週末くるけどそろそろバージョンくる?
2008/06/13(金) 22:13:22ID:C4TWwqL/0
「バージョンくる」の意味が分からなかったのでグッてみた

ver・sion

━━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.
2008/06/17(火) 00:56:18ID:Xfg2HjBN0
たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ?
2008/06/21(土) 00:53:55ID:yQj9zf0a0
>86
バージョンこないから試してみようとしたけど起動しないや・・・
94名無しさん@お腹いっぱい。
垢版 |
2008/06/22(日) 14:26:00ID:pB/qsvyu0
俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
         ∨
           ___                _
       / ____ヽ           /  ̄   ̄ \
       |  | /, −、, -、l           /、          ヽ きみ頭だいじょうぶ?
       | _| -|○ | ○||         |・ |―-、       |
   , ―-、 (6  _ー っ-´、}         q -´ 二 ヽ      |
   | -⊂) \ ヽ_  ̄ ̄ノノ          ノ_ ー  |     |
    | ̄ ̄|/ (_ ∪ ̄ / 、 \        \. ̄`  |      /
    ヽ  ` ,.|     ̄  |  |         O===== |
      `− ´ |       | _|        /          |

【 南極堂...断罪アイアンメイデン 】  http://www42.atwiki.jp/ironmaiden/
2008/06/24(火) 19:11:24ID:E9lO0sbvO
どうもです。

ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。
2008/06/25(水) 00:16:50ID:EIbNz7bk0
待ってます
2008/06/25(水) 00:18:37ID:YlNT0tor0
待っています。
2008/07/06(日) 13:26:22ID:eE09r6G00
みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?

これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。

indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。


あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。
2008/07/06(日) 19:54:39ID:y2E+4QJQ0
>>98
何言ってる
2008/07/06(日) 23:14:28ID:q9kMgqrU0
>>98
どうもです。

このソフトでは保存してる全てのログから、検索語を漏らすこと無く
検索するので他のものより遅いのではと思います。
ソフトの性能かもしれないです。
みみずん検索の仕組みがどういうものか知りませんが・・・
2008/07/07(月) 00:57:51ID:5BhNo3f50
>100
あ、そっか。
みみずん検索は検索板を指定しましたね。
長期使ってないから全板検索だと勘違いしてました orz
■ このスレッドは過去ログ倉庫に格納されています
大学生アイラと影の怪物と戦うリョウが、深夜3時3分の静止した世界で交錯する超常スリラーの概要

ニューススポーツなんでも実況