あとは文字コードかね、そのサイトはSJISだからダメ文字も

それから直接関係ないが、無造作に * を使うのは危ない
<a href="*">hoge というマッチパターンの * はクォートもタグも踏み越えて
「">hoge」 が見つかるところまで進んでしまう
さらにそういうフリーダムな * が複数あるとバックトラックが爆発的に増えて遅くなることがある

原則として * は範囲を制限するものとセットで使う、こんな風に
<div class="jobInfoBlock_201112">
$INEST(<div,*<a href=$AV(*)>$LST(weban)</a>*,</div>)
</div>