Proxomitron フィルター作成スレッド Part15
■ このスレッドは過去ログ倉庫に格納されています
"pageElement" : "//a[starts-with(@href, '/imgres?imgurl=')]/../parent::tr"
"nextLink" : "//img[@src='nav_next_2.gif']/parent::a" 今まで
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.0; T312461; Q312461)
に偽装してSSLは回避出来てたけど、画像は諦めてたわ
>>96で画像直リンいけた。
さんくす>>96 >>102
マジだった
Mozilla/4.0でもいろいろ挙動違うんだな
サンクス [Patterns]
Name = "weban fillter"
Active = TRUE
URL = "area-baito.weban.jp"
Limit = 8192
Match = "<div class="jobInfoBlock_201112">*"
"<a href="*">$LST(weban)</a>*"
"</div><!--/.jobInfoBlock_201112-->"
Replace = "test"
求人サイトwebanの
リストに社名入れてその社名の求人表示を
ブロックしたいのですが上手くいかないです
もしかしてブロックリストって日本語だめなんでしょうか
一例として
http://area-baito.weban.jp/webapp/are/PSPCALI200L.do?A1=03&FID=300&V5=1&V4=4&V3=50&OP=610000803&V1=83&V10=12&AQ=75110&Z1=801&CMD=300&V13=60
このページのバックスグループの求人をブロックしたいです >>105
Naoko-4.5June+8を使用しています
$LST(weban)をアスタリスクにして
デバッグURLコマンドで求人の該当箇所を
エディタのテスト欄に放り込んでテストしたら動きました
$LST(weban)だとだめなんです
リストにはきっちり「株式〜支店」まで
始めから終りまで入れています
あとどの辺見るべきでしょうか あとは文字コードかね、そのサイトはSJISだからダメ文字も
それから直接関係ないが、無造作に * を使うのは危ない
<a href="*">hoge というマッチパターンの * はクォートもタグも踏み越えて
「">hoge」 が見つかるところまで進んでしまう
さらにそういうフリーダムな * が複数あるとバックトラックが爆発的に増えて遅くなることがある
原則として * は範囲を制限するものとセットで使う、こんな風に
<div class="jobInfoBlock_201112">
$INEST(<div,*<a href=$AV(*)>$LST(weban)</a>*,</div>)
</div> バックスグループ
[%83][%6f][%83][%62][%83][%4e][%83][%58][%83][%4f][%83][%8b][%81][%5b][%83][%76] >>107
書き直していただいたマッチ文で
ブロックリストへ
・平文
株式会社バックスグループ千葉支店
Proxomitron文字列変換 (Web版)で
・EUC-JP
[%83][%6f][%83][%62][%83][%4e][%83][%58][%83][%4f][%83][%8b][%81][%5b][%83][%76]
・UTF-8
[%E6][%A0][%AA][%E5][%BC][%8F][%E4][%BC][%9A][%E7][%A4][%BE][%E3][%83][%90][%E3][%83][%83][%E3][%82][%AF][%E3][%82][%B9][%E3][%82][%B0][%E3][%83][%AB][%E3][%83][%BC][%E3][%83][%97][%E5][%8D][%83][%E8][%91][%89][%E6][%94][%AF][%E5][%BA][%97]
3通り試しましたが上手くマッチしませんでした
wikiのダメ文字判別にかけると
[Patterns]
Name = "Shift_JIS dameji escaper (test only)"
Active = FALSE
Limit = 20000
Match = "\1"
Replace = "$WESC(\1)"
【株式会社バックスグル―[プ千葉支店】と出力されるので
平文では駄目いう事くらいは分かったのですが [Patterns]
Name = "New HTML filter"
Active = TRUE
Limit = 256
Match = "[%83][%6f][%83][%62][%83][%4e][%83][%58][%83][%4f][%83][%8b][%81][%5b][%83][%76]"
Replace = "hogehoge" [Patterns]
Name = "weban fillter"
Active = TRUE
URL = "area-baito.weban.jp"
Limit = 8192
Match = "<div class=$AV(jobInfoBlock_201112)>"
"$INEST(<div,*<a href=$AV(*)>$LST(weban)*</a>*,</div>)"
"</div>"
Replace = "<font size=1 color=AAAAAA>[BLK]</font>"
なんとかうまく動くようになりました、ありがとうございます
・ダメ文字テストで出力されたものをリストに貼り付け
・リストをS-JISエンコードで保存
二つ目を忘れてました…すみません ログウィンドウでログをctrl+Cでコピーすると100%落ちるんですが
皆さんどうですか?
Naoko-4.5June+8 以前ログでフィルタチェックしたときに何度か落ちたな
落ちることもあるし落ちないこともあるって感じだったけど うちだと落ちはしないけど特定のフィルタログのところに勝手に飛んでその行がコピーされる Ctrl+W、B、G、Y、V はそれぞれ白&グレー、青、緑、黄、紫の行を順番にフォーカスする
Ctrl+R はリセットで消えるので赤には飛べない
Ctrl+C は水色があればそこにフォーカスした上でコピーする。水色がなければそのままコピーできる Google画像検索やっぱ思うようにいかない。
UA「Mozilla/4」だと画像直リン可だけどセーフサーチが無効にできない。
UA送らないとセーフサーチ無効にできるけど画像直リン不可。
画像直リンとセーフサーチ無効を両立できてる人いる?
つかほとんどの環境で設定やパラメータによらずセーフサーチを無効にできないらしいけど
強制的にセーフサーチを無効にする方法って無いのかな? 俺の場合セーフサーチは無効になってるけど、
通常検索で、検索結果を新しいウィンドウで開く、がONなのに機能してないわ
まぁこれはフィルタで対応したからいいけど scriptを除去するために次ように書きました。
検索文字列: <script*/script>
置換文字列: (なし)
しかし一部が除去されずに残ってしまいます。
何かヒントをもらえないでしょうか どこからどこまで消えて何が残ってるのか見れば原因わかるだろ limitじゃね
その内緒にしてるサイトがわからないとこれ以上のヒントなんて出せない >>121-122 ↓このページです。
「STAP細胞研究者の小保方晴子さん中2時の読書感想文(全文)」
http://xn--xlro74ciuuldj.jp/obokata-haruko-2156
●オリジナル
<!DOCTYPE html>
<!--[if lt IE 7 ]><html class="ie6" lang="ja"><![endif]-->
<!--[if IE 7 ]><html class="ie7" lang="ja"><![endif]-->
<!--[if IE 8 ]><html class="ie8" lang="ja"><![endif]-->
<!--[if IE 9 ]><html class="ie9" lang="ja"><![endif]-->
<!--[if (gt IE 9)|!(IE)]><!--><html lang="ja"><!--<![endif]-->
<!--[if !(IE 6) | !(IE 7) | !(IE 8) ]><!-->
<html dir="ltr" lang="ja">
<!--<![endif]-->
<head>
●置換後
<!DOCTYPE html>
<!--//--><script src="http://local.ptron/WindowOpen.js"></script>
<!--//--><script> function NoError(){return(true);} onerror=NoError; </script>
<!--//--><script> function moveTo(){return true;}function resizeTo(){return true;}</script>
<!--[if lt IE 7 ]><html class="ie6" lang="ja"><![endif]-->
<!--[if IE 7 ]><html class="ie7" lang="ja"><![endif]-->
<!--[if IE 8 ]><html class="ie8" lang="ja"><![endif]-->
<!--[if IE 9 ]><html class="ie9" lang="ja"><![endif]-->
<!--[if (gt IE 9)|!(IE)]><!--><html lang="ja"><!--<![endif]-->
<!--[if !(IE 6) | !(IE 7) | !(IE 8) ]><!-->
<html dir="ltr" lang="ja">
<!--<![endif]-->
置換をするとオリジナルにはないコードが出現するのは何故だろう?
何かオレ勘違いしてる???? >>123
ttp://proxomitron.sakura.ne.jp/help/Contents.html >>124-125
ありがとう(・∀・)
あと、
ほかにも消えないscriptがあったので limit を増やして解決しました。
ありがとう>>122 twitter.comのHTTPS転送を回避する方法って無いです?
アカウントを作るつもりは無い。 なんでセキュア通信を嫌がるの?
前から気になってた ショッピングサイトとかなら、嫌がるどころかむしろなかったら論外だよ
しかし、セキュアである必要が全くどこにもない動画サイトの閲覧だとか
短文投稿サイトの閲覧だとかで強制的にSSLを使われて
フィルタに支障が出るというのは、うざいことこのうえない 転送自体はLocationヘッダのフィルタで止められるだろうけど、
それだと内容は表示しないサイトもあるからなぁ。 「安全なページにSSLeay/OpenSSL使う」をチェックしてるけど
twitterとかfacebookだとCPU100%になったり不具合多いよね ふたば更新
[Patterns]
Name = "futaba: AdDel (140329)"
Active = TRUE
Multi = TRUE
URL = "[^/]++.2chan.net/"
Limit = 1024
Match = "[%8d][%4c][%8d][%90]:::<b>*</b><br>"
"|$NEST(<div,\sstyle\=$AV(width:728px;height:90px;margin:2px\sauto)*,</div>)"
"|$NEST(<div,\sstyle\=$AV(width:468px;height:60px;margin:2px)*,</div>)"
"|$NEST(<div,\sstyle\=$AV(width:336px;height:280px;margin:2px)*,</div>)"
"|$NEST(<div,\sclass\=$AV(tue)*,</div>)"
"|$NEST(<div,\sid\=$AV(rightad)*,</div>)"
"|$NEST(<(table|div),\sclass\=$AV(ama)*,<(/table|/div)>)"
"|<!--2-->*<!--3-->" youtubeがSSLに飛ばされるようになったんだけど回避どうすればいいの
[HTTP headers]
In = FALSE
Out = TRUE
Key = "User-Agent: Unknown UA"
URL = "www.youtube.*/"
Match = "*"
んんんんn Mozilla/4.0 (compatible; SimpleResultPlz/1.0) ふたば更新
404に対応
[Patterns]
Name = "futaba: AdDel (140413)"
Active = TRUE
Multi = TRUE
URL = "[^/]++.2chan.net/"
Limit = 1024
Match = "[%8d][%4c][%8d][%90]:::<b>*</b><br>"
"|$NEST(<div,\sstyle\=$AV(width:728px;height:90px;margin:2px\sauto)*,</div>)"
"|$NEST(<div,\sstyle\=$AV(width:468px;height:60px;margin:2px)*,</div>)"
"|$NEST(<div,\sstyle\=$AV(width:336px;height:280px;margin:2px)*,</div>)"
"|$NEST(<div,\sclass\=$AV(tue)*,</div>)"
"|$NEST(<div,\sid\=$AV(rightad)*,</div>)"
"|$NEST(<(table|div),\sclass\=$AV(ama)*,<(/table|/div)>)"
"|<!--2-->*<!--3-->"
"|<HR> $NEST(<iframe\sframeborder\=\"0\"*,</iframe>) <HR>" youtubeで最初からHDや大型プレーヤーにしてくれるフィルター出来ないかな? Youtube High Definitionみたいな
ブラウザアドオン使ったほうが簡単かも >>137
どもです
実はそれ使ってみたんだけど、なぜか音ズレする不具合に悩まされたもので
普通にアドオン消してHDにすれば何の問題もないのでフィルターで出来たら良いなと [HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: twipic"
Match = "http://pbs.twimg.com/media/([^?]++)\1.(jpg|png|gif)\2\s"
Replace = "$JUMP(http://pbs.twimg.com/media/\1.\2:orig?.\2)" BypassにURLがあるサイトを、特定のウェブページフィルタだけを適用させる方法はありますか? Bypassではなく$RDIR(http://\xload//cfg?url)するリストを作って、
その特定のウェブページフィルタだけを書いたcfgに切り替えさせるしか手はないと思う >>143
ありがとう。その方法は初めて見たので調べながらやってみます。 ユーザースタイルシートを使っていると
セキュリティの警告が消えないの? ふたば更新。どうやら尼は見限られたようだ
てかふたばって広告主がひろゆきの代理店と同じじゃん?
[Patterns]
Name = "futaba: AdDel (140519)"
Active = TRUE
Multi = TRUE
URL = "[^/]++.2chan.net/"
Limit = 1024
Match = "$NEST(<div,\sstyle\=$AV(width:728px;height:90px;margin:2px\sauto)*,</div>)"
"|$NEST(<div,\sstyle\=$AV(width:468px;height:60px;margin:2px)*,</div>)"
"|[%8d][%4c][%8d][%90]:::<b>*</b><br>"
"|$NEST(<div,\sclass\=$AV(tue)*,</div>)"
"|$NEST(<div,\sid\=$AV(rightad)*,</div>)"
"|$NEST(<div,\sstyle\=$AV(width:336px;height:280px;margin:2px)*,</div>)" やってることはせこい権力振りかざしてるカス以外のなにものでもないのだが
キャラ作りが奏功してわりと住人に受け入れられてる奴だな
ジェンヌとは全然違うんじゃないか、こっちは誰からも嫌われてるババアだろ 西村みたいに自演でキャラ作ってる感じもするな。
最近の実況板の件もそうだが昔からやってることに好感が持てたことが無いのに
何故か親しみを持てるキャラってことになってる。 Google検索のリダイレクタお願いできませんでしょうか。
事情があってPC+スマホで月3GBでやっていかねばなりません。
そこで通信量節約のためパソコンでもモビライザーを利用しようと思いました。
動画も見ないし大きなファイルのDLはコンビニのWiFiでやるから1日100MBなら
余裕と思ってたら意外にそうでもありませんでした。何でだろうか。
ちなみにスマホではFilterProxyも利用してますが、それでも結構ギリギリです。
それでGoogle検索結果の一覧ページからURLをクリックする時に
Shiftキーを押しながらでinstapaperモビライザー、
Ctrlキーを押しながらでGoogleモビライザーにジャンプしてほしいのですが
ttp://mobilizer.instapaper.com/m?u=[URL]
ttp://www.google.co.jp/gwt/x?hl=ja&u=[URL]
Googleの各サービスがSSL化したりしてますが、仕様とか変わって今は出来なくなってるのでしょうか? SSLだとオミトロンは通らない(いじってない限りは)
ユーザーエージェントを変えればSSLにならないことが可能。
このスレじゃないかもしれないけど、どっかで書かれてた。
あと、Refererも見て、モビライザーのページからのCSS要求とかはそのままにしないと問題あるかも? Google検索の強制SSLはGoogle自身がその回避用URL(http://216.239.32.20/)を用意してくれてるから
$RDIRなんなりでリダイレクトしてやれば回避出来るよ
youtubeは知らない >>154-155
ありがとうございます。この間やっと手を付け始めたのと、コンビニからでないと書き込めないので遅れました。
↓他の人のを参考にしつつ書いた途中経過のもの(とりあえず$KEYCHKはあとで)
In = FALSE
Out = TRUE
Key = "URL: Google -- Direct jump mobi (Out)"
Match = "https://www.google.co.jp/url*url=http%3A%2F%2F([^\&]+)*"
Replace = "$JUMP(http://mobilizer.instapaper.com/m?u=$UESC(\1))"
httpsのページの中身を書き換える訳じゃなくてリダイレクトしたいだけなんだけど、それでもこれだと駄目みたいです。
次にSSLでない検索結果ならいいのかな、と思い >>96 さんのを追加してUAを変えてみましたが、
例えば「xperia」とかで検索しても結果はhttps://〜のページになってしまいます。
どうすればいいでしょうか。 >>156-157
あ、書き込んだ後に……
すみません、帰ってから試してみます。ありがとうございました。 >>147
こんないいものがあったのか
最近は広告をやたら増やしててウザったかったからありがたい Match = "www.test.com/([0-9]+)\1"
Replace = "www.test2.com/\1"
って
www.test.com/123
www.test.com/123456
だけ置換すると思ったら
www.test.com/abc123
www.test.com/abcdef
も置換しちゃうんだけど
どうやんの? +は0回以上の繰り返しだからな
www.test.com/([0-9]+{1,*})\1
としてやればいい >>163
> +は0回以上の繰り返し
うー そうなのね・・・
([^/]++|)youtube.com/
ずっとこういう書き方してたわ
ショック・・・ >>164
>([^/]++|)youtube.com/
それだと nisesaito_youtube.com/ にもマッチしてしまうよ。
ドットを追加して↓こうしてたのなら、別に無駄な書き方じゃないと思うが。
([^/]++.|)youtube.com/ <a href="url" attr="value">title</a>
<a href="url">title</a>
「attr="value"」のない<a>タグだけにマッチさせたいんです
$NEST(<a\s,(^attr="value")+,</a>)
ダメだ・・・ >168
こういうこと?
$NEST(<a,\s((^attr="value")?)+,</a>) フィルターの作成お願いします。
fc2.comを見ていると画面下に黒い帯が出てくることがあります。
毎回Xで閉じるのが面倒なので非表示に出来ないでしょうか。
これです。
>この広告は6ヶ月以上更新のないサイト・作成以降未更新のサイトに表示されます。
>ファイルマネージャまたはFTPでファイルが更新されるとこの広告は表示されなくなります。 多分ここにいるような奴は、機能的にどうしても必要なサイト以外のJSは切ってる ページ全体のABCを全部DEFに置換するのは簡単だけど
指定範囲内のABCを全部DEFに置換するにはどうしたら良いんでしょうか?
[Patterns]
Name = "test"
Active = TRUE
Multi = TRUE
Bounds = "$NEST(<dive\s,</div>)"
Limit = 512
Match = "\1ABC\2"
Replace = "\1DEF\2" multiplematchオンでフィルタ10個なり100個なりコピーするとか
・・・他の方法は俺には思い付かない (START*)\#ABC$SET(check=true)
|
ABC$TST(check=?*)$SET(#=DEF)
|
(END)\#$SET(check=)
を使っている。
ここまで書いて思ったけど、
(\#ABC$SET(#=DEF))+\#じゃできない?
\#に入るのが100個までっていう制約があるけど(=消せるABCが50個ぐらいまで)。 >>182
1番最初のABCが置換されずに消滅する >>182
上の方をBounds無しにしてできました。
ありがとうございました。 >>183
あ、ほんとだ。
しかも、START...END...ABCもマッチすることに気付いた。
使うときは書き換えよろ >>185
(START*)\#ABC$SET(#=DEF)$SET(check=true)
としても消えちゃう。
> START...END...ABCもマッチすることに気付いた。
これは・・・? 584 :名無しさん@お腹いっぱい。:2006/09/21(木) 10:49:45 ID:HmV2FAMw0 ?BRZ(1008)
>>575-576
ヤフーミュージックはpart1だけ作り変えた。
[Patterns]
Name = "Yahoo! Music swf -> txt part1 (2006_09_21)"
Active = TRUE
URL = "http://music.yahoo.co.jp/shop/"
Bounds = "$NEST(<script,</script>)"
Limit = 2560
Match = "*http://music.yimg.jp/lyrics/lyrics.swf\?id=([a-z0-9]+{1,*})\1\&aid=([0-9]+{1,*})\2*"
Replace = "<iframe src="http://music.yimg.jp/bin/sendlyricstext\?ArtistId=\2\&Id=\1" height="400" width="600"></iframe>"
うたまっぷはpart1のURLマッチだけ書きかえた
[Patterns]
Name = "Uta-map swf -> txt part1 (2006_09_21)"
Active = TRUE
URL = "www.utamap.com/(showtop.php\?surl=|phpflash/flashfalsephp.php\?unum=)"
Limit = 32767
Match = " $NEST(<object\s,*<embed\s[^>]++src=$AV(phpflash/showkasi.swf\?ucode=([a-z0-9]+)\0)*,</object>) "
"|"
"<NOSCRIPT*</NOSCRIPT>"
"|"
"<SCRIPT*</SCRIPT>"
"|"
"test[0-9]+=[0-9]+\&test[0-9]+="
Replace = "$TST(\0=[a-z0-9]*)"
"<iframe src="http://www.utamap.com/phpflash/flashfalsephp.php?unum=\0?" height="400" width="600">\r\n"
"This filter use IFrame Tag! your browser cant't use this Tag.\r\n"
"</iframe>\r\n" 過去スレにあった↓のフィルター
うたまっぷのtoppageにリンクされている歌詞はテキスト化できるけど、
検索画面から歌詞に行ってもundefinedと表示されるだけ。
どうしてでしょうか?。教えていただけると幸いです。よろしくお願いします。
584 :名無しさん@お腹いっぱい。:2006/09/21(木) 10:49:45 ID:HmV2FAMw0 ?BRZ(1008)
うたまっぷはpart1のURLマッチだけ書きかえた
[Patterns]
Name = "Uta-map swf -> txt part1 (2006_09_21)"
Active = TRUE
URL = "www.utamap.com/(showtop.php\?surl=|phpflash/flashfalsephp.php\?unum=)"
Limit = 32767
Match = " $NEST(<object\s,*<embed\s[^>]++src=$AV(phpflash/showkasi.swf\?ucode=([a-z0-9]+)\0)*,</object>) "
"|"
"<NOSCRIPT*</NOSCRIPT>"
"|"
"<SCRIPT*</SCRIPT>"
"|"
"test[0-9]+=[0-9]+\&test[0-9]+="
Replace = "$TST(\0=[a-z0-9]*)"
"<iframe src="http://www.utamap.com/phpflash/flashfalsephp.php?unum=\0?" height="400" width="600">\r\n"
"This filter use IFrame Tag! your browser cant't use this Tag.\r\n"
"</iframe>\r\n" 日本語を完璧に扱えるように改善したオミトロン作れやスコット まじで代替ツール欲しい。動いてるからこれでいいのかも知れんけど amate/Proxydomo
https://github.com/amate/Proxydomo
代替最有力はこれじゃね、ぼちぼち更新されてるし だいぶ前からあるのに未だに代替として機能してないのは残念だね SSL対応してるらしいけど、良さげじゃないか?まだ使ってみてないけどw ■ このスレッドは過去ログ倉庫に格納されています