X



Proxomitron フィルター作成スレッド Part15

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2013/10/29(火) 16:19:30.16ID:StfYrAS+0
Proxomitron等に関するWiki
http://abc.s65.xrea.com/prox/wiki/

Proxomitron専用Uploader
http://www42.tok2.com/home/proxo/

Thinking Archive(仮)
http://vird2002.s8.xrea.com/

【前スレ】
Proxomitron フィルター作成スレッド Part14
http://anago.2ch.net/test/read.cgi/software/1326800481/

---- 関連スレ ----
【前スレ】Proxomitron Part 31
http://toro.2ch.net/test/read.cgi/win/1328625684/

■■■■Proxomitron入門スレッド■■■■6
http://kohada.2ch.net/test/read.cgi/pcqa/1201242934/

ニコニコ動画専用オミトロンソフト板 Part29
http://anago.2ch.net/test/read.cgi/software/1338891644/
0365名無しさん@お腹いっぱい。
垢版 |
2015/09/27(日) 22:01:48.72ID:bHHInX4V0
楽天の商品ページが重過ぎるため、軽くする方法のひとつとして、
http://item.rakuten.co.jp/(ショップ名)/(商品番号)
のページ内の「http://item.rakuten.co.jp」へのリンクを削除したいです(画像を含む場合は画像ごと)
(商品ページを開いているときは、他商品へのリンクは表示しない)
で、下のように書いてみたのですが
$NEST(<a*href="http://item.rakuten.co.jp,<;/a>)
どうも誤爆してるようで、何も表示されなかったり、レイアウトが崩れまくってしまいます
ショップ側がHTMLコーディングをミスってる可能性もありますが、
もっと良い書き方があったら教えてください
0369名無しさん@お腹いっぱい。
垢版 |
2015/09/28(月) 12:54:40.17ID:EaeYlhdx0
$NESTの第1要素はタグのみを指定しなさい
*は誤爆しやすいから<>内はもっと正確に[^>]++で消費しなさい
0373名無しさん@お腹いっぱい。
垢版 |
2015/09/29(火) 02:41:59.18ID:s3xPe1eF0
個人的には肯定先読みの方が$INESTより組みやすいし応用できる
$INESTは使い方にクセがあるみたいでうまく使えないんだな
0377名無しさん@お腹いっぱい。
垢版 |
2015/10/17(土) 20:04:49.82ID:T9OBA7GB0
画像があるページのURLは抜き出せるけど画像への直リンを生成するのは無理になったぽいね
無根拠な推測をすると、どっかから「画像をキャッシュするな!」とか「画像URLを含むURLを生成するな!」ってクレームでもあったのかな?
一時的な試験だけで明日には元に戻るといいんだけど
0380名無しさん@お腹いっぱい。
垢版 |
2015/10/19(月) 03:12:06.39ID:aj9oqMcf0
Googleのソースは詰め詰めで面倒くさいのだよなあ
FirebugやらInspectorやらがなければ投げ出しているわ
0392名無しさん@お腹いっぱい。
垢版 |
2015/11/25(水) 19:15:42.77ID:U6uldX7I0
ヘッダ>User-agent:~~~のoutにチェック>OK>バイパスを押す
IEにlocalhostと設定したポートをプロキシに設定
UAチェックサイトで確認するも、変化なし
0394名無しさん@お腹いっぱい。
垢版 |
2015/11/25(水) 20:07:15.53ID:U6uldX7I0
出来ました
あとjane styleスレでも聞いてるけど
janeだと動作しない
!chkBBx:UAでUAを見ても変わってない
0397名無しさん@お腹いっぱい。
垢版 |
2015/11/25(水) 21:09:05.03ID:U6uldX7I0
↓これをやりたけどスレタイの[転載禁止]と&copy;2ch.netが消えない

以下2つのフィルタをProxomitronに追加し設定を保存

[HTTP headers]
In = TRUE
Out = FALSE
Key = "URL: 2ch.net subject.txt filtering rev.2 (151116) (in)"
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt $FILTER(true)"

[Patterns]
Name = "2ch.net: subject.txt filtering rev.2 (151116)"
Active = TRUE
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt"
Limit = 16
Match = "([ ]|)\[[%93][%5D][%8D][%DA][%8B][%D6][%8E][%7E]\]([ ]|)|\&(copy|#169);2ch.net"

終わったらスレ一覧を更新
間違っていなければスレタイの[転載禁止]と& >>728,733
Proxomitron用ならこれ
本体は適当にみつけて拾ってきて
使い方に関しては触れないので各々ドキュメントやwiki等を参照の事

Proxomitronを起動したら設定→HTTPタブでポート番号を確認
然る後JaneStyleにProxyの設定をする(ヘルプ見れ)
デフォのままなら アドレス:localhost port:8080
設定するのは受信用だけでいい

終わったら以下2つのフィルタをProxomitronに追加し設定を保存

[HTTP headers]
In = TRUE
Out = FALSE
Key = "URL: 2ch.net subject.txt filtering rev.2 (151116) (in)"
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt $FILTER(true)"

[Patterns]
Name = "2ch.net: subject.txt filtering rev.2 (151116)"
Active = TRUE
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt"
Limit = 16
Match = "([ ]|)\[[%93][%5D][%8D][%DA][%8B][%D6][%8E][%7E]\]([ ]|)|\&(copy|#169);2ch.net"
0399名無しさん@お腹いっぱい。
垢版 |
2015/11/25(水) 21:11:38.86ID:U6uldX7I0
↓これでスレタイの[転載禁止]と©2ch.netを消したいけど出来ない

以下2つのフィルタをProxomitronに追加し設定を保存

[HTTP headers]
In = TRUE
Out = FALSE
Key = "URL: 2ch.net subject.txt filtering rev.2 (151116) (in)"
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt $FILTER(true)"

[Patterns]
Name = "2ch.net: subject.txt filtering rev.2 (151116)"
Active = TRUE
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt"
Limit = 16
Match = "([ ]|)\[[%93][%5D][%8D][%DA][%8B][%D6][%8E][%7E]\]([ ]|)|\&(copy|#169);2ch.net"
0416名無しさん@お腹いっぱい。
垢版 |
2015/11/26(木) 23:21:45.06ID:n4I9D1S70
Fix MIMEを有効にしてMIME Fix List.txtでtxtのMIMEをtext/htmlにせなあかんの?
txtにproxomitronを作用させる方法ってそれしかないの?
0417名無しさん@お腹いっぱい。
垢版 |
2015/12/04(金) 16:33:33.33ID:l5+/newu0
○○が無い場合にマッチ、って言う表現って実現可能?
^ 使っても、○○以外にマッチにしかならないよね

例えばURL
www.hogehoge.com/hoge.php
があったとして
フッターっつーか
www.hogehoge.com/hoge.php?=hoge
の ? 以降が無い場合付け足すとかそういう用途を想定してるんだけども、どうだろう
やっぱ無理なのかな
0421名無しさん@お腹いっぱい。
垢版 |
2015/12/05(土) 00:54:44.40ID:M4xow+MN0
同一WiFi内でPC内のプロキシに2chMateを接続してスレ欄取得しようとしてもURLが間違っているか〜〜ってなって取得出来ない
2chGearならできる
0424名無しさん@お腹いっぱい。
垢版 |
2015/12/05(土) 16:31:47.11ID:4ovc7Cp10
ヘッダフィルタのURLのマッチを

[^/]++.2ch.net(:80|)/[^/]+/subject.txt $FILTER(true)

にしても.txtがログにも全く引っかからないんですがどうすればいいですか?
.htmlなら出来るんですが
0425名無しさん@お腹いっぱい。
垢版 |
2015/12/05(土) 17:37:43.86ID:4ovc7Cp10
と思ったらログは取れてた
けどwebページフィルタ当てれない
mineをtext/htmlに書き換えたら出来るようになるけど書き換えると2chmateでスレ欄を取得できなくなる
0433名無しさん@お腹いっぱい。
垢版 |
2015/12/06(日) 06:58:07.51ID:h9JS1sAm0
styleスレにフィルタ貼ったばっかりにこんなのが現れるようになって
正直すまんかった

[HTTP headers]
In = FALSE
Out = TRUE
Key = "Accept-Encoding: HTTP_ACCEPT_ENCODING Header Delete for 2ch (Out)"
URL = "[^/]++.2ch.net(:80|)/[^/]+/subject.txt"
Match = "*"

mime typesは消せ
0435名無しさん@お腹いっぱい。
垢版 |
2015/12/08(火) 00:05:46.80ID:KWgeGAnG0
久しぶりにNo object!!(似非NoScript)をメンテしたので
欲しい方が居たらどぞ

ttp://prx.dip.jp/wiki/?plugin=attach&pcmd=info&file=No%20object!!_20151207.zip&refer=Uploader

[変更点]
・リスト「Allow_AllObject.txt」の追加。(何もブロックしなくていいサイトのURLを記載するためのリスト)
・スクリプトタグ内の「script.src = '/js/map' + abc + '.js';」みたいな記述を外部スクリプトときちんと認識するよう修正
・No object!!でブロックしている場合に表示される画面右上の四角形が表示できないケースがあるのを修正
0437名無しさん@お腹いっぱい。
垢版 |
2016/01/10(日) 01:29:11.43ID:jkioL//n0
>>436
たまにJavaScriptでコンテンツ(ページとかコントロールとか)の表示・非表示を行っているサイトがあって
そういうところはホワイトリストに追加してあげないと見れないよ
0438名無しさん@お腹いっぱい。
垢版 |
2016/01/10(日) 08:07:17.67ID:JlhFWmkP0
そういうサイトはスクリプトなしでも表示されるようにページを書き換えるわ

body style="display:none" とかfoldingリストとかlazyとか大嫌い
0439名無しさん@お腹いっぱい。
垢版 |
2016/01/10(日) 20:33:07.97ID:6gla9E+k0
>>437
そういうサイトもあるだろうけど、All Aboutの場合はJavaScriptでコンテンツのロードや
表示/非表示をコントロールしているわけじゃなく、ブラウザ自体でJavaScriptを無効に
していてもページ自体は表示できるサイトだよ

件の場合はheadの途中に
<script>window.jQuery || document.write('<script type="text/javascript" src="外部スクリプト.js"><\/script>')</script>
のようなところがあって、ここで2つ目の<script〜行末の閉じタグまで置換されて
先頭の開始タグが残ってしまい、このため以降全てがscriptタグ内に書かれたもの
ということになってしまっている
0440名無しさん@お腹いっぱい。
垢版 |
2016/01/10(日) 22:36:11.17ID:cZSQ3T7G0
scriptタグを$NESTで取ろうとするとよくあるな
scriptの場合は<script*</script>でbounds取ったほうがよさげ
0441名無しさん@お腹いっぱい。
垢版 |
2016/01/12(火) 00:18:53.14ID:Jd3k/x9X0
No object!!(似非NoScript)を更新
変更点は以下参照してください

ttp://prx.dip.jp/wiki/?plugin=attach&pcmd=info&file=No%20object%21%21_20160112.zip&refer=Uploader

[変更点]
1. Replace full path for No object!!の対象範囲の拡大
2. 内部スクリプトブロック時の判定の修正
3. 外部スクリプトブロック時の判定の修正
4. ブロックした場合、ソースの削除ではなくコメントアウトを行うように変更

「/foo.js $URL(http://bar.com/*)」などブロックリストにプロトコルからではなく
スラッシュから記載している場合、変更点1に伴って記載を変更する必要があるかもしれません。


>>436
これでいいのかな
0445名無しさん@お腹いっぱい。
垢版 |
2016/02/27(土) 14:26:31.50ID:bv7+p6Rr0
素朴な疑問なんだけど、リストの扱いってどうなってんだろうな

Divに肯定先読みで$AV噛ませてリストからマッチしたら置換
みたいな簡単なフィルタなんだけど
リストに ABC XYZ って入れて置換を確認した後
ABC XYZ
ABC
って追記したら、何故か ABC XYZ が反応しなくなった
ABC
ABC XYZ
の順番にしたら両方反応するようになったけど、どういう事なんだろう
0447名無しさん@お腹いっぱい。
垢版 |
2016/02/27(土) 14:57:07.68ID:4j3CYzGF0
Non-hashed Itemは、記述した順番でマッチ

Hashed Item は、候補が複数あるときどれにマッチするかは未定義と考えるべき
記述順を変えれば変化するけど、どう変化するかは予測できない
0448名無しさん@お腹いっぱい。
垢版 |
2016/02/27(土) 17:54:44.14ID:bv7+p6Rr0
ほうほう、なるほど
予測できないんだ
参考になる

Kill nest adなんかでとっきどき作動しない事があるのも
そういう事なんだろうなぁ
0450名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 21:57:03.64ID:fWqwEMbJ0
☆ 日本の核武装は早急に必須です。☆
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。
0451名無しさん@お腹いっぱい。
垢版 |
2016/05/15(日) 12:57:01.79ID:Q4AEkcDv0
スレチっぽいので改めて質問します

288 : 名無しさん@お腹いっぱい。2016/05/15(日) 00:35:18.45 ID:Q4AEkcDv0
置き換えスタック使っているんですけど
以下のフィルターに対して
例えば「<p>VVV @XXX @YYY ZZZ</p>」が
「<p>VVV <a href="https://twitter.com/XXX";>@XXX</a> <a href="https://twitter.com/YYY";>@YYY</a> ZZZ</p>」にならず
「<p>VVV <a href="https://twitter.com/YYY";>@YYY</a> <a href="https://twitter.com/YYY";>@YYY</a> ZZZ</p>」になってしまう
これは仕方ないんですかね、\1が上書きされてしまうのは
\1を\#にすると当然エラーが出て使えません
<p>タグの範囲を外せば対応できますけどかなり重くなるので避けたいです

[Patterns]
Name = "Twitter垢リンク"
Active = TRUE
Multi = TRUE
Bounds = "<p>*</p>"
Limit = 512
Match = "(\#@(([0-9a-zA-Z_])+)\1$SET(\#=<a href="https://twitter.com/\1">@\1</a>))+\#"
Replace = "\@"
0452名無しさん@お腹いっぱい。
垢版 |
2016/05/15(日) 15:08:43.66ID:U8J/nFCv0
<p>の前の閉じタグから消費してmultiple matchとかどうでしょう

</div><p>VVV @XXX @YYY ZZZ</p>

Multi = TRUE
Bounds = "[^<]++><p>*</p>"
Match = "(*<p>*)\#@(???)\1$SET(#=[\1])\#"
0453名無しさん@お腹いっぱい。
垢版 |
2016/05/21(土) 11:56:00.96ID:cmhQVlny0
>>452
遅くなってごめんなさい
multipleにしても一つのファイルに対して一回しかフィルターが通らないので
同じフィルタを何度も登録するしか方法がなさそうです
0456名無しさん@お腹いっぱい。
垢版 |
2016/05/21(土) 15:19:18.55ID:BGeiPpwn0
>>455じゃダメだな
良く見てなかったけどYYYが2回続くね

もうグローバル変数使ってこんな感じでやるのがいいのではなかろうか
ただ「<p>VVV <a href="https://twitter.com/XXX";> @XXX</a> @YYY ZZZ</p>」みたいなのは誤爆するけど

[Patterns]
Name = "new filter"
Active = FALSE
Limit = 2560
Match = "(<p>)\#$SET(P_TAG=y)"
"|(</p>)\#$SET(P_TAG=)"
"|@([0-9a-z]+)\1$SET(\#=<a href="https://twitter.com/\1">@\1</a>)$TST(P_TAG=y)"
Replace = "\@"
0457名無しさん@お腹いっぱい。
垢版 |
2016/05/21(土) 20:19:11.28ID:fvEpM1J70
うーん、未テストだから調整が必要だろうけど自分ならたぶんこうやるかな
p要素内に限定しないと重くなる=twitter垢っぽい文字列が頻繁に出てくると解釈して最初にリンクを張るべきか$TSTするようにしてみた

Match = "(^(^$NEST(<p,>*@[0-9A-Za-z]++\s*,</p>)))$SET(TWITLINK=1)"

Match = "$TST(TWITLINK=1)@([0-9a-zA-z]+)\1$SET(\#=<a href="https://twitter.com/\1">@\1</a>)"
Replace = "\@"

Match = </p>$SET(TWITLINK=)

あとは、10個以上リンク張るなんてことはそうそうないっていうならこうとか?

Match = "$NEST(<p,>\#@([0-9A-Za-z]+)\1$SET(\#=<a href="https://twitter.com/\1">\1</a>)"
"(\#@([0-9A-Za-z]+)\2$SET(\#=<a href="https://twitter.com/\2">\2</a>)|\#)"
"(\#@([0-9A-Za-z]+)\3$SET(\#=<a href="https://twitter.com/\3">\3</a>)|\#)"
(以下\0までコピペして修正)
"\#"
",</p>)"
0461459
垢版 |
2016/06/22(水) 23:46:54.25ID:16WvJ6Zr0
>>460
ありがとうございます。
試してみます。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況