X



Fiddler 2chプロクシ専用 Part1 [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2015/03/26(木) 23:24:16.96ID:YucLrJ+j0
htmltodatByFiddler
 要.NET Framework (webスクレイピング)
 ttp://mukiyu.g.ribbon.to/ 【v1.05   v2.02 (v2系は差分取得対応)】
 ttp://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038409548/
(要参照 ttp://anago.2ch.net/test/read.cgi/software/1426589898/763
 ttp://www.telerik.com/download/fiddler
0544名無しさん@お腹いっぱい。
垢版 |
2018/03/09(金) 20:47:48.32ID:fR1Ds25G0
>>537
通常のBrowserで使い物にならないほど醜いUIだからこそ
2ch専用ブラウザが使われてきた。
汎用ブラウザでもアプリのようなUIを実現する技術もある。
そういう努力をせずに、専用ブラウザ頼みにしているのが悪い。

例えばログイン制にすればよく見るスレッドの登録、ここまで読んだ機能など
専用ブラウザの基本機能は汎用ブラウザでも実現できる。
いつまでもIP address単位でアクセス管理をする20年以上前の発想から
抜け出せずにいる。
0545名無しさん@お腹いっぱい。
垢版 |
2018/03/09(金) 20:51:22.16ID:fR1Ds25G0
>>537
あと広告なくても掲示板は利益出るよ
掲示板のデータはひろゆき時代から外部の企業に売られてるしさらに
IP addressのように個人を特定しうるまで紐づけられてる可能性高い。

広告なし専用ブラウザでの利用が大半だった時代にも
ひろゆきは億単位の年収得ていたのはそういう仕組み
0547名無しさん@お腹いっぱい。
垢版 |
2018/03/09(金) 20:55:14.80ID:fR1Ds25G0
>>538
読みもしないスレッドを読み込むと解釈するほうがバカ。
定期チェックしてるスレッドは専用ブラウザのタブで残っているしそれの
新着レスを一括でチェックするだけ。
専用ブラウザのごく一般的な使い方だろう
API公開していれさえいれば最小限の負荷で差分だけ送信できる。
0548名無しさん@お腹いっぱい。
垢版 |
2018/03/09(金) 21:15:27.06ID:VUM6MueJ0
>>547
>API公開していれさえいれば最小限の負荷で差分だけ送信できる
それはお前の都合だ
この人思い込みだけで何も知らん人だな
0549名無しさん@お腹いっぱい。
垢版 |
2018/03/09(金) 21:26:36.80ID:fR1Ds25G0
>>546
それは失礼、どの部分の主語なのかわからない。
UIが悪く、ログイン制なしは時代遅れっていうのは
ひろゆき時代、JIM時代で共通の話だよ

あと今の運営が掲示板データを売っていないという根拠は?
純正専用ブラウザでGoogle絡みのライブラリが入ってるんだから
個人情報と紐づけられてるのはほぼ確実
Googleは広告屋だから必ずやってる
0551名無しさん@お腹いっぱい。
垢版 |
2018/03/09(金) 21:52:56.85ID:OW5YZfWb0
>>543
xenoだと
「全てのタブの新着チェック」だとタブの数ぶんread.cgi叩くけど
「全てのタブの更新チェック」だと板ごとのsubject.txtを読むだけだ
とりあえずそちらで運用してみてはどうだろう

自分もxenoで数十タブ開いてて日に最低一度は全タブ更新チェック使って
たまに実況もするけどGoneはまだ食らったことない
0552名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 02:26:46.91ID:d7BtX4RE0
xenoって公式だったっけ?
あとread.cgi叩いてスクレイピングするのは規約違反だけどなw
だからそういうのを5ちゃんねるは塞いでるんだろ
それでも叩き続けると今度はお手紙が来るんじゃないかなw
0554名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 02:45:23.48ID:AnMTWwzR0
このスレにいるからって開き直らないといけないわけじゃないだろ
現状知りつつも隙間で静かに生きてこうとしている人間からしたら、ID:fR1Ds25G0みたいな馬鹿と同類に見られたくない
0555名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 07:49:45.95ID:4PiwBrr60
>>551
「全タブの更新チェック」使ったことなかったから試してみたけど
なぜか反映されるのが遅いね。
新着レスあるのに見た目の変化がない。
「「全タブの新着チェック」の代替にはならない感じ。

上側の板名ダブルクリックして新着カラムでソートして
新着あるスレッドだけ読んでいく方法なら反映も早そうだった。
ただし多くの板をみている場合、面倒な作業になる。
0556名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 08:01:17.85ID:4PiwBrr60
>>552
アホだな
Fiddlerで2ch使ってる人の多くはスクレイピングはhtmlアクセスで
合法だからこそFiddler使ってきた意識の高い人たち。
スクレイピングは汎用ブラウザと同じ方法でアクセスするから法律に抵触しない

htmlアクセスを防ぎたいなら通常ブラウザからのアクセスを禁止すればいい
規約作った奴は確実に馬鹿だ

お手紙がくるとかいってるのは汎用ブラウザの広告ブロッカー使ったら
手紙がくるといってるレベルのバカ発言だぞ
0557名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 09:38:38.96ID:1rrKSmpn0
スクレイピングが法律に抵触しないからセーフなら
サービス側が広告掲示するのも非許可専ブラに対抗措置を執るのもセーフなんだしどうもこうもないっしょ
0558名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 10:26:55.80ID:kj/rTcpl0
>>552
>あとread.cgi叩いてスクレイピングするのは規約違反だけどなw
山下は似たようなこと言ってるけど
その根拠は何もないのよ
5ch運営はアナウンスしてないから
山下にしたってスクレイピングで禁止してるのは専ブラの開発だし
そもそもread.cgiで作成されたhtmlページは公開されてるもので
個人的にどう整形して見ようが文句言われる筋合いはないわな
0559名無しさん@お腹いっぱい。
垢版 |
2018/03/10(土) 12:28:10.86ID:GJMjRg050
>>556
「高い人たち」っていかにもその人数を把握してなきゃ返ってこない答えですね
あらあらもしや元締めの方でしたか?
そりゃ騒がれると困りますものねw
0562551
垢版 |
2018/03/10(土) 23:16:28.75ID:wF1+CoTc0
>>555
自分は使っていて「反映が遅い」と感じたことはないけど
見た目の変化がないスレを見ようとしたことがないからかもしれない。
サーバ側の処理の都合で、datに書き込まれたレス数と
subject.txt上のレス数がタイミングによって食い違うことがあるのかもしれない。

でも手軽な代替案として悪くはないと思うけどね。
「新着(更新)チェックの精度」と「Goneのリスク」を比較した場合。
0564名無しさん@お腹いっぱい。
垢版 |
2018/04/12(木) 11:52:59.31ID:0Bifuisu0
fiddlerのユーザーエージェントをデフォルトedgeやfirefoxにする方法はありませんか
起動時にdisabledになっているのでワッチョイの後半も(disabled)に対応した文字列になってしまいます
fiddlerでの接続は圧倒的に少数派なので知識ある人が辿ればレスが紐付けされそう(変な書き込みはしてませんが、web上半永久的に残る者なので気を付けたいです)
心配なので今は起動時に手動でUAを変更しています
0567名無しさん@お腹いっぱい。
垢版 |
2018/04/12(木) 19:25:39.96ID:Jkh9YBQc0
>>564
カスタムルールの頭ら辺に、UA一覧定義があるだろ。
デフォルトにしたいUAの文字列の最後に", true"を追記すればいい。

RulesStringValue(11,"IE 10 (Win8)", "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0)", true)

みたいに。
これをやれば、htmltodatByFiddlerを直す必要はない。
0569名無しさん@お腹いっぱい。
垢版 |
2018/04/12(木) 19:45:13.41ID:Jkh9YBQc0
>>568
あと、dat読み込みと書込みを共通化したいなら、htmltodatByFiddlerで追加した

oSession.oRequest["USER-AGENT"] = "Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko";



oSession.oRequest["USER-AGENT"] = sUA;

にすれば、両方ともFiddlerのUAメニューで変更出来るよ。
0571名無しさん@お腹いっぱい。
垢版 |
2018/04/18(水) 00:49:40.35ID:hS65b0Qg0
普段ブラウザで見てるので、たまにしかfiddlerを起動しないんだけど、
久しぶりに立ち上げるとバージョンチェックするかと聞かれるのを消す方法無い?
0574名無しさん@お腹いっぱい。
垢版 |
2018/05/24(木) 21:20:55.32ID:rk4diJlv0
すいません、質問させてください。
Fiddlerをieとサーバ間のプロキシとして使用しようとしているのですが、
@Fiddlerが対応できるCipherSuiteの追加方法、
AFiddlerとサーバ間で作成した共通鍵をFiddlerがキャッシュとして保持してる場合、その在り方

この2点もしご存知でしたら教えてください…
また見当違いの事を言ってたらご指摘していただけるとありがたいです。
0575名無しさん@お腹いっぱい。
垢版 |
2018/05/24(木) 23:50:34.58ID:YpVWv3A10
>>574
その環境でFiddlerを使用したい目的がわからないが
HTTPSの設定はオプションにある
たぶんやりたいこととFiddlerの機能は異なると思う
0577名無しさん@お腹いっぱい。
垢版 |
2018/05/25(金) 00:40:22.82ID:nTgFxK0g0
>>574
デフォはシステム依存なのでXPはTLS1.1以降は対応できない
なのでプラグインで例えばOpenSSLなど外部ライブラリを利用するものを自作することになる
残念ながらFiddlerで使える汎用的なSSLプラグインは見当たらないけど

以前調べた時のサイトを参考までに
http://www.bouncycastle.org/csharp/
Fiddlerで公開されているCertMakerの元になったものと思われる
Fiddler用ではないのでsrcを改造することになるだろう
https://github.com/vcsjones/FiddlerCertGen
これはシステムにあるライブラリ依存でデフォを少し機能拡張したものかと
Fiddlerプラグイン作成の参考にはなるだろう
0578名無しさん@お腹いっぱい。
垢版 |
2018/05/25(金) 21:10:13.95ID:TwEHIEKJ0
>>577
やはり追加するとなるとプラグイン等が必要になるのですね。
教えていただいたサイト見てみて、考えてみます。
レスありがとうございます。
0579名無しさん@お腹いっぱい。
垢版 |
2018/06/02(土) 07:39:20.14ID:Ggf72fwd0
最近、Ubuntu18.04LTS(Linux)使い始めたのだが、FiddlerってLinux版もあるのな
誰かFiddler Linux版のプロクシー作ってくれないか?

そのまま、htmltodatコピーしてもだめだった
0581名無しさん@お腹いっぱい。
垢版 |
2018/06/02(土) 13:33:53.01ID:Ggf72fwd0
>>580
monoとかいうソフトのが.net関係らしい
どっかの会社が.netのLinux対応版を作ってたのをMicrosoftが買収したらしい
0582名無しさん@お腹いっぱい。
垢版 |
2018/06/02(土) 13:34:30.24ID:Ggf72fwd0
>>580
ちなみにLinux版は拡張子が.jsじゃくて.csになってる
0583名無しさん@お腹いっぱい。
垢版 |
2018/06/03(日) 01:29:31.76ID:/Mab58CZ0
>>582
何のためにUbuntuを入れたんだよ・・・
拡張子の通り中身はC#
SampleRules.csを見て自分で直せばいい
ただし直せたとしてもLinux版はベータなのでどこまで動くかはわからない

もしくは最初からLinux対応のproxyを探すか
自分で解決する気がないならWindowsを使ったほうがいい
0584名無しさん@お腹いっぱい。
垢版 |
2018/06/03(日) 21:36:19.91ID:aUpk8YKX0
>>583
やっぱそのままhtmltodatの内容コピペしてもだめなの?

ほとんどCustomRules.jsとCustomRules.csの中身ほとんど一緒だから
そのまま行けるかと思ったけど

WineでJaneXeno起動して、Fiddler通すまでは確実に出来る
ただ、CustomRules.csをFiddlerが読み込まないから2chスレが読み込めない
2chのスレ一覧はJaneXenoで読み込める

C#使えるなら直してくれよ
0585名無しさん@お腹いっぱい。
垢版 |
2018/06/03(日) 21:47:37.27ID:aUpk8YKX0
一応、htmltodatの作者様にもお願いしといたのだが、Linux版作ってくれるってよ
これでLinuxでもJaneXeno+Fiddler+htmltodatbyFiddlerで動くぞ
0589名無しさん@お腹いっぱい。
垢版 |
2018/06/07(木) 06:51:19.45ID:BjMGwmtf0
>>588
DNS LookupだからFiddler関係ないだろ
0593名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 14:11:19.15ID:DW0KlMSn0
みんな書き込めてるの?
「不正なPROXYを検出しました」と出て実況以外どこも書き込めなくなってもた。。。
0598名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 16:27:20.44ID:DW0KlMSn0
教えてもらったところの変更とクッキーの削除もしてみましたが
うちのはダメでした、おま環(Win10,JaneStyle)ってヤツなのかも・・・
仕方ない…今は諦めよう!もし書き込めるようになったらまた来ます(´・ω・`)/ありがとうございました
0601名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 19:26:56.34ID:ILdPckjx0
うちでも駄目だったな
ニュー速だけだと思ってたがここも書き込めなくなってる
めんどくせー
0602名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 20:11:30.88ID:/SodvTSa0
てst
0603名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 11:31:10.10ID:KO5DpN1Z0
はあ?これで行けるだろ

//読み込み時のUAを変更したい場合は以下を変更
oSession.oRequest["Accept-Encoding"] = "gzip";
oSession.oRequest["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:60.0) Gecko/20100101 Firefox/60.0";
}

//書き込み(bbs.cgi)についての処理は以下で
if (oSession.url.match(/bbs.cgi$/)) {
//5chへの書き込みリクエストを2chへの書き込みリクエストに変換
//oSession.url = oSession.url.replace(/\.5ch\.(net)/,".2ch.$1");

//書き込み時のUAを変更したい場合は以下を変更
oSession.oRequest["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:60.0) Gecko/20100101 Firefox/60.0";
}
//ここまで
0606名無しさん@お腹いっぱい。
垢版 |
2018/06/19(火) 18:56:35.52ID:xYcWe27P0
>>593です
>>599-600,603
UAは教えてもらったモノや調べて新しそうなものを片っ端等から試したり
SimpleCookiePermission.txtというファイルを作るというのもやってみましたがうちの環境ではダメでした><
うちの場合バイナリを変更する必要があったみたい
みんな助けてくれてありがとうございました
0607551
垢版 |
2018/06/19(火) 23:51:58.64ID:O+85sgS60
せっかくのFiddlerなんだからUIのInspectorsにRequestとResponseのログ残ってるだろ
それを(差支えない範囲で)貼れば状況解明に役立つかもしれないのに
0608名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 00:11:27.85ID:l9TiPaVt0
ちなみに書けてるうちではこんな感じ。Acceptヘッダはちょっと弄ってる

POST http://egg.5ch.net/test/bbs.cgi HTTP/1.0
Connection: close
Content-Type: application/x-www-form-urlencoded
Content-Length: 457
Cache-control: no-cache
Pragma: no-cache
Host: egg.5ch.net
Accept: text/html
Referer: http://egg.5ch.net/software/
User-Agent: Monazilla/1.00 (JaneXeno/170110)
Cookie: (略)

submit=(略)

HTTP/1.1 200 OK
Date: Tue, 19 Jun 2018 14:51:58 GMT
Content-Type: text/html; charset=Shift_JIS
Connection: close
x-Resnum: 607
Set-Cookie: (略)
Vary: Accept-Encoding
Server: cloudflare
CF-RAY: 42d6d118975e6eed-NRT
(以下略)
0609名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 00:15:45.26ID:pac5oDZG0
こういうことらしい

794 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2018/06/16(土) 12:54:04.00 ID:AucSE6lv0
Acceptヘッダが"text/html, */*"だと5ch側で弾くようになったっぽい
0610名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 00:29:52.06ID:l9TiPaVt0
>>609
それは自分も別スレで見て試してみたんだけど弾かれなかったんだよな
>>608のAcceptヘッダを試してみたけどこれも弾かれない

まあ正解が何かはまだわからないけど、Acceptヘッダは

oSession.oRequest["Accept"] = "text/html";

こんな感じで弄れる(もちろんOnBeforeRequestな)
0614名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 02:03:09.44ID:8sgZuQBy0
てst
0615名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 02:04:08.47ID:8sgZuQBy0
Xenoだから何も変えずにずっと書き込みできてる
困ってる奴はこれを機にXenoに変えるのもありだぞ
0617名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 16:21:24.72ID:v5x2ukX30
Accept: text/html
User-Agent: Monazilla/1.00 (JaneXeno/170110)

次はこれで弾かれるんだろうなw
0620名無しさん@お腹いっぱい。
垢版 |
2018/06/21(木) 02:40:16.14ID:yQjefoE90
>>617
それはとっくに弾かれてるぞ

>>619
>>617のUser-Agentじゃ弾かれるぞ
UAを>>603に変えればおk
0621名無しさん@お腹いっぱい。
垢版 |
2018/06/21(木) 02:41:05.54ID:yQjefoE90
てか、最新のhtmltodatならUA変わってるんじゃないの?
0622名無しさん@お腹いっぱい。
垢版 |
2018/06/21(木) 04:49:54.27ID:aBeVR4yq0
>>621
最新って2.26だよな

//読み込み時のUAを変更したい場合は以下を変更
oSession.oRequest["Accept-Encoding"] = "gzip";
oSession.oRequest["User-Agent"] = "Mozilla/6.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko";
}

//書き込み(bbs.cgi)についての処理は以下で
if (oSession.url.match(/bbs.cgi$/)) {
//5chへの書き込みリクエストを2chへの書き込みリクエストに変換
//oSession.url = oSession.url.replace(/\.5ch\.(net)/,".2ch.$1");

//書き込み時のUAを変更したい場合は以下を変更
//oSession.oRequest["User-Agent"] = "Monazilla/1.00 JaneStyle/3.84 Windows/6.3.9600";
}
//ここまで


たしか"Mozilla/6.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko"は弾かれてたはず
書き込みUAも一般ブラウザのものに変えといた方がいい
JaneStyle/3.84は古いバージョンだし山下に金が入るのも癪だし

あとプログラミングを少しでも齧ったことがある人なら常識だけど、「//」を削除してなくてUA変更が反映されてない人もいそう
0623名無しさん@お腹いっぱい。
垢版 |
2018/06/21(木) 05:13:40.07ID:aBeVR4yq0
ちなみにIE11のUAはWindows7の64bitだと"Mozilla/5.0 (Windows NT 6.1; Win64; x64; Trident/7.0; rv:11.0) like Gecko"

そもそもMozilla/6.0なんて吐くブラウザなんてあるの?って話
0634名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 09:49:30.03ID:XtRtb1Cu0
最近のFiddlerのCustomRules.jsは、JScript.NET以外にC#も
使える様になったんだね。
Linux版はC#しか使えないみたいなので、C#版もあるといいよね。
0636名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 11:21:48.24ID:XtRtb1Cu0
>>635
作者の掲示板を見ると、既に出来てるみたいよ。
ただ、旧2chの古いread.cgiが無くなってて、一部動作検証出来ないみたいね。
0637名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 15:07:34.87ID:v4NgEUYO0
>>636
出来てるじゃん
誰かはよ、Linux上でWine+Fiddler+htmltodatByFiddlerで出来るかやってみてくれ
0640名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 19:51:47.19ID:WHrkVrQr0
>>639
正式版と間違えてテスト版をアップしてしまいました。すみませんが破棄してください。
今から正式版アップしなおします。
0641名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 21:08:41.45ID:ABx9xf/+0
とりあえず俺用C#版OnBeforeRequest.cs.txtの変更点
コメントで※が付いてるのが変更点

//読み込み時のUAを変更したい場合は以下を変更 ※Chrome偽装だとVersionUPでUAが頻繁に変わってズレるのでIE11UAで固定化
oSession.oRequest["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; Win64; x64; Trident/7.0; rv:11.0) like Gecko";
}

//書き込み(bbs.cgi)についての処理は以下で
if (oSession.url.ismatch(@"bbs.cgi$")) {
//5chへの書き込みリクエストを2chへの書き込みリクエストに変換
//oSession.url = oSession.url.replace(@".5ch\.(net)/,".2ch.$1");

//書き込み時のUAを変更したい場合は以下を変更 ※読み込み時とUAを同じにする
oSession.oRequest["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; Win64; x64; Trident/7.0; rv:11.0) like Gecko";
oSession.oRequest["Accept"] = "text/html";
//UAに汎用ブラウザのものを指定する場合「ブラウザ変ですよん」のエラーになることがあるがこの一行で回避できるようだ
//※俺のIE11のAccept-Languageが"ja-JP"なので
oSession.oRequest["Accept-Language"] = "ja-JP"; }
//ここまで
0642名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 21:40:18.71ID:RL1oNTqC0
>>641
もっと完全を期するなら

if (oSession.oRequest.headers.ExistsAndContains("Accept", "text/html, */*")) {
oSession.oRequest["Accept"] = "text/html";
oSession.oRequest["Accept-Language"] = "ja-JP";
}

にすると、規制対象のJane系以外は何も変更しないで済む。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況