X



Fiddler 2chプロクシ専用 Part1 [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2015/03/26(木) 23:24:16.96ID:YucLrJ+j0
htmltodatByFiddler
 要.NET Framework (webスクレイピング)
 ttp://mukiyu.g.ribbon.to/ 【v1.05   v2.02 (v2系は差分取得対応)】
 ttp://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038409548/
(要参照 ttp://anago.2ch.net/test/read.cgi/software/1426589898/763
 ttp://www.telerik.com/download/fiddler
0640名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 19:51:47.19ID:WHrkVrQr0
>>639
正式版と間違えてテスト版をアップしてしまいました。すみませんが破棄してください。
今から正式版アップしなおします。
0641名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 21:08:41.45ID:ABx9xf/+0
とりあえず俺用C#版OnBeforeRequest.cs.txtの変更点
コメントで※が付いてるのが変更点

//読み込み時のUAを変更したい場合は以下を変更 ※Chrome偽装だとVersionUPでUAが頻繁に変わってズレるのでIE11UAで固定化
oSession.oRequest["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; Win64; x64; Trident/7.0; rv:11.0) like Gecko";
}

//書き込み(bbs.cgi)についての処理は以下で
if (oSession.url.ismatch(@"bbs.cgi$")) {
//5chへの書き込みリクエストを2chへの書き込みリクエストに変換
//oSession.url = oSession.url.replace(@".5ch\.(net)/,".2ch.$1");

//書き込み時のUAを変更したい場合は以下を変更 ※読み込み時とUAを同じにする
oSession.oRequest["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; Win64; x64; Trident/7.0; rv:11.0) like Gecko";
oSession.oRequest["Accept"] = "text/html";
//UAに汎用ブラウザのものを指定する場合「ブラウザ変ですよん」のエラーになることがあるがこの一行で回避できるようだ
//※俺のIE11のAccept-Languageが"ja-JP"なので
oSession.oRequest["Accept-Language"] = "ja-JP"; }
//ここまで
0642名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 21:40:18.71ID:RL1oNTqC0
>>641
もっと完全を期するなら

if (oSession.oRequest.headers.ExistsAndContains("Accept", "text/html, */*")) {
oSession.oRequest["Accept"] = "text/html";
oSession.oRequest["Accept-Language"] = "ja-JP";
}

にすると、規制対象のJane系以外は何も変更しないで済む。
0644名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 09:24:23.69ID:YOMbZbds0
Firefoxもよくアップデートくるけどメジャーバージョンアップ以外(セキュリティ関連のアプデ)ではUAの変更なしだから
Chrome偽装よりは最新UAに合わせるのがだいぶ楽だよな
0646名無しさん@お腹いっぱい。
垢版 |
2018/07/12(木) 22:35:07.36ID:hPU1mLny0
>>645
見れるよ
0649名無しさん@お腹いっぱい。
垢版 |
2018/07/19(木) 10:24:33.16ID:qdI2fsBM0
goneエラーが頻発するようになった
クソ運営が規制強めやがったか
0650名無しさん@お腹いっぱい。
垢版 |
2018/07/19(木) 13:56:27.94ID:7E3c8O880
こっちは何も変わらんなー
0657名無しさん@お腹いっぱい。
垢版 |
2018/07/19(木) 14:34:38.95ID:kcV3DYeK0
まじか。俺もjanestyleなのになぁ
ちなみにブラウザでは?
一覧は読み込めるけどスレを開くとgoneになる
0658名無しさん@お腹いっぱい。
垢版 |
2018/07/19(木) 14:41:42.25ID:7E3c8O880
ブラウザの通信にはfiddlerを通さないようにしてた気がするので開けるけど…それがどこの設定だったかは忘れちゃった
0662名無しさん@お腹いっぱい。
垢版 |
2018/09/27(木) 04:47:35.43ID:p+8hMS6T0
てすと
0668名無しさん@お腹いっぱい。
垢版 |
2018/12/01(土) 15:27:09.12ID:7rDZjt+v0
>>667
俺もそうなった
あと番号がズレて増えてる
0670名無しさん@お腹いっぱい。
垢版 |
2018/12/01(土) 16:43:06.15ID:Tgn7muiZ0
styleは今んとこ大丈夫かな・・・さっきこのスレを開いたときは破損になってたから怪しいけど
0673名無しさん@お腹いっぱい。
垢版 |
2018/12/01(土) 17:47:00.54ID:AsHm+Hgm0
XENOだけど
どのスレ開いてもスレ番201から216までが壊れるわ
0675名無しさん@お腹いっぱい。
垢版 |
2018/12/01(土) 17:53:18.48ID:43s6JBSt0
<div><div id="horizontalbanners*99"〜
<!-- Insert user GDPR consent string here for GDPR compliant inventory -->
で広告が5つぐらい挟まってるな
0677名無しさん@お腹いっぱい。
垢版 |
2018/12/01(土) 18:00:03.50ID:7rDZjt+v0
515まであるところ見たら
673さんの報告の所が壊れてた
あと417〜432も壊れてた
0678名無しさん@お腹いっぱい。
垢版 |
2018/12/01(土) 20:04:32.40ID:mUkO0d1h0
>>675以外にAAとレスポップアップ用のclassも入ってるんだな、と言ってもこれについては以前のverからあったようだが
あと少し前からpinkにも広告がレス間に追加されてる
0680名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 00:15:04.83ID:dIU1V9t90
アンカーがずれまくるな
0682名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 04:14:24.53ID:TapPir8h0
C#版だと問題ない(もともと対応済み)みたいだけど、導入しようとしても
janeに「(;゚Д゚)datジャナイ…」って言われて取得できん(´・ω・`)
0684名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 04:58:37.93ID:TapPir8h0
> ・メソッド
>  public static void OnBeforeResponse(Session oSession)
>  の最後(次の public static 〜 に直近の } の上)に OnBeforeResponse.cs.txt を挿入

readmeにはこう書いてあるけど、OnBeforeResponse.cs.txtを挿入する場所を
「// This function executes just before Fiddler returns an error that it has 」のある行の
1つ上の「}」の上にしたらC#でも行けた

一応、他に俺はいつも「//2chへの読み込みリクエストを〜」と
「//5chへの書き込みリクエストを〜」の下のコメントアウトを外して使ってるけど、
関係あるのかな?分からん(´・ω・`)
0685名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 13:23:33.49ID:dDjMAYXn0
xenoでC#版に移行したけど
//5chへの書き込みリクエストを2chへの書き込みリクエストに変換
//oSession.url = oSession.url.replace(@".5ch\.(net)/,".2ch.$1");
のコメント外すとエラー出てダメだったけど読み込みは問題なくなった
0687名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 14:39:50.14ID:TapPir8h0
>>685
自分の環境でもそうなるからコメントアウトしたままだな
コメントアウトしないと「文字 '$' は予期されていません」って言われるわ(´・ω・`)
0688名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 14:58:40.32ID:TapPir8h0
説明不足だったので追記。
↓こうすればコメント外してもいける。(「(net)」の後ろの「/」を「"」(半角ダブルクォーテーション)に書き換え)

oSession.url = oSession.url.replace(@".5ch\.(net)",".2ch.$1");
0689名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 16:40:17.45ID:Ar2zR2nW0
使ってたfiddler v4.5.1.2ではC#版を使えないようだったのでv5.0.20182.28034にアップデート後、Customize RulesでhtmltodatByFiddler(C#版)を導入すると
「コンパイラが必要とする型 'System.Runtime.CompilerServices.ExtensionAttribute' が見つからないため、新しい拡張メソッドを定義できません。System.Core.dll への参照は指定されていますか?」
というエラーが出たので以下を追加してみたら使えるようになったので、同じエラーが出た人用に参考までに
0690名無しさん@お腹いっぱい。
垢版 |
2018/12/02(日) 16:41:43.83ID:Ar2zR2nW0
using System.IO;

namespace System.Runtime.CompilerServices {
// 拡張メソッドをコンパイルするのに必要となるExtensionAttributeの宣言
[AttributeUsage(AttributeTargets.Assembly | AttributeTargets.Class | AttributeTargets.Method)]
public sealed class ExtensionAttribute : Attribute {}
}

namespace MyExtensions {
// 拡張メソッドを含むクラス
public static class StringExtensions {
public static void WriteTo(this string str, TextWriter writer)
{
writer.Write(str);
}
}
}

namespace Test {
// 拡張メソッドを使用するコード
using MyExtensions;

class MainClass {
static void Main()
{
"Hello, world!\n".WriteTo(Console.Out);
}
}
}
//ここまで追加
0693名無しさん@お腹いっぱい。
垢版 |
2018/12/03(月) 14:00:34.87ID:MyobQRau0
コピペする箇所が2つ増えるだけやぞ
それも数行、さっさと移行しよう
fiddlerのバージョン上げる作業の方がめんどいくらい
0695名無しさん@お腹いっぱい。
垢版 |
2018/12/03(月) 19:53:27.41ID:JE4SPOS60
>>694
自分の環境向けに直し忘れてるんじゃないかな?例えばこれ
//2chへの読み込みリクエストを5chへの読み込みリクエストに変換 5ch対応の板一覧を使っていれば多分不要
//oSession.url = oSession.url.replace(@".2ch\.(net)",".5ch.$1");
0698名無しさん@お腹いっぱい。
垢版 |
2018/12/04(火) 19:44:37.52ID:FmODKUp20
今までviewでjscript版使ってたんだが差分取得がずっと上手くいってなかった
今回のトラブルをきっかけにC#版に乗り換えたらその不具合も消えたんだけど何が良くなかったんだろう
0702名無しさん@お腹いっぱい。
垢版 |
2018/12/05(水) 08:01:26.08ID:TSGmzx9X0
なんか途中で間違って編集してバグったからcsファイル削除して
一からやり直したら上手く導入できたわ

C#最高!
0704名無しさん@お腹いっぱい。
垢版 |
2018/12/19(水) 15:34:35.48ID:9ea3BA3x0
jane xeno + fiddler + htmltodat(C#)
使ってるんだけど、302出まくって
まともにスレ表示されないぞ

xenoで動いてる奴いる?
0706704
垢版 |
2018/12/19(水) 22:16:21.87ID:xWFYCjbo0
>>705
うちは、
JaneXeno 170110

Fiddler
v5.0.20181.13826 for .NET 4.6.1
Built: 2018年3月12日

で説明通りに書き換えたのですが、302エラー連発です。
XenoのバージョンとFiddlerのバージョン教えてください。
出来れば、CustomRules.csうpお願いします。
0709名無しさん@お腹いっぱい。
垢版 |
2018/12/22(土) 01:10:07.44ID:E8qwdjKT0
>>707
いや、違うっぽい

>>708
ありがとう
やっぱ、それと全く同じだわ
それでも302で見れません

Fiddlerが最新じゃないからかな
まあ、後でFiddler更新してみます
0710名無しさん@お腹いっぱい。
垢版 |
2018/12/26(水) 03:35:14.59ID:xGyAmQWs0
どっかのアホのLinux使いのせいで本体更新とC#移行を余儀なくされたわ
余計なこと言いやがってアホが!
0712名無しさん@お腹いっぱい。
垢版 |
2018/12/26(水) 12:15:50.15ID:ghxTVbD00
これまでのJSを修正して使っても問題ないけどな
C#版は抽出生成を行なうように変更したようだからネイティブアプリ版での様々なサイト用を移植しやすくなったんじゃないか?
0713名無しさん@お腹いっぱい。
垢版 |
2019/01/20(日) 04:53:57.82ID:RQHBcaet0
fiddlerがここ最近毎日一回、起動時に更新チェックするようになってしまった
うっとうしいので再インスコしたが直ってなさそう
設定が見つからなかったんだけど対処法ありますか?
0714名無しさん@お腹いっぱい。
垢版 |
2019/01/20(日) 21:38:12.87ID:8rSE+7W30
http://toki.5ch.net/test/read.cgi/utu/1235037797/
http://toro.5ch.net/test/read.cgi/utu/1303907977/
http://toro.5ch.net/test/read.cgi/utu/1360587077/
http://peace.5ch.net/test/read.cgi/utu/1392139978/
http://peace.5ch.net/test/read.cgi/utu/1428006895/
http://echo.5ch.net/test/read.cgi/utu/1449288300/

上のスレdat変換してくれないんだけど理由わかるかな
htmlでは表示出来てるんだけど
0715名無しさん@お腹いっぱい。
垢版 |
2019/01/20(日) 23:59:12.25ID:nrooYOYq0
>>713
Optionsの一番最初に「Notify me for update on startup」てまんまの項目あるけど
以前「設定しても効いてない」って報告あったな
起動オプションで何とかなると思う このスレを「更新チェック」で検索
0716名無しさん@お腹いっぱい。
垢版 |
2019/01/21(月) 00:24:56.60ID:ZifT5Xvr0
>>714
それは専ブラ側の問題かも
XenoとかのJane系だと、その板があった昔の鯖(tokiとかtoroとか)ではなく
現在の鯖(mevius)を見に行って「そんなスレないです」て返されることがある
Xenoの場合だと、正しい対処法は知らないけど経験的には
該当板のスレをすべて閉じてから専ブラを再起動すれば元の鯖のURLで
アクセスできるようになると思う
0717名無しさん@お腹いっぱい。
垢版 |
2019/01/22(火) 21:48:00.17ID:llLlZhBP0
>>716
ありがとう
どうにも上手くいかなかったのでhtmltodat使って原始的にdat保存してみたよ
こっちも便利だね助かる
0718名無しさん@お腹いっぱい。
垢版 |
2019/01/27(日) 13:44:02.01ID:hcVWVo620
>>715
情報ありがとう
何日か検証したが自分の環境では/noversioncheckは無意味だったが
/quietをつけたら更新チェックされなくなった
0721名無しさん@お腹いっぱい。
垢版 |
2019/06/22(土) 06:14:30.51ID:wkixON2R0
>>720
ありがとうできたわ
スレ内でも過去に話題になってたんだな
ちゃんと検索すべきだったすまぬ

しかしquietオプションは存在消えるから驚くな
あれ、ショートカットダブルクリックしてるのに全然起動しないと数分悩んだ(´・ω・`)
0724722
垢版 |
2019/08/25(日) 21:59:05.94ID:EybA2k1D0
正確に言うと実況headlineとなんJヘッドラインとなんでも実況Jが開けない
スレ一覧は更新できる
実況headlineとなんJヘッドラインはHTTP/1.1302 Found
なんでも実況JがHTTP/1.1 410 Goneとエラーを吐く症状です
0726名無しさん@お腹いっぱい。
垢版 |
2019/08/26(月) 02:45:21.08ID:qp6oI6UA0
なんかそこらへんの板だけ末尾に「/」が入ってないとエラー吐くみたいね
応急処置だけど「oSession.url = v.g(1) + "/test/read.cgi/" + v.g(2) + "/" + v.g(3)」の後に「 + "/"」を追加して
リクエスト用のURL末尾に「/」が付加されるようにすればとりあえず読みこめる
0731名無しさん@お腹いっぱい。
垢版 |
2020/01/11(土) 00:22:33.18ID:YhWngSrM0
egg.5ch.net
が410出るようになったな
0732名無しさん@お腹いっぱい。
垢版 |
2020/01/11(土) 02:52:23.57ID:ib5OUOnA0
見れねーと思ってここ来たらここも見れなくて草
どうも一般的なブラウザ以外のUAだと410になるみたい
とりあえず「読み込み時のUAを変更したい場合は以下を変更」の下のoSession.oRequest["User-Agent"]......の前のコメントアウトを外す(//を消す)と読み込める
0736名無しさん@お腹いっぱい。
垢版 |
2020/01/12(日) 09:39:23.21ID:5oozHf+r0
うちはコメントアウトを外してもダメだったけどそのコメントアウトを外した状態のまま
FiddlerのUAをDefaultからChromeにしたらいけた
0738名無しさん@お腹いっぱい。
垢版 |
2020/01/26(日) 09:15:42.73ID:tg2bBfvZ0
Xenoでは過去ログを取得できるものの、Styleではできない場合、どんな原因が考えられるでしょうか
両方共に Proxyを使用する 127.0.0.1 8888の設定はしています
Styleの方は、Fiddler側のログがHots:Tunnel to URL:鯖名.5ch.net:443 Body:0になっています
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況