みなさん回答ありがとうございます
>>866
XML関係の知識が必要になるようなので調べてみます
>>868
試してみましたが、日本語文字列が入るとURLとして判別してくれませんね
ただ特定タグを含む行の抽出はできるので、他の整形ソフトと組み合わせればいけそうです