Javaで文字列処理のお話。
タグ中の中身やら属性やら、タグが正しいかどうかというチェックするような
メソッドやらライブラリやらなかったかな。
知ってる方、教えてください(まぁ自分でも調べますが)。
Hoge <tag1 attr="true">hoge</tag1> foo bar
ほげ<tag2 attr="false">ほげ</tag2>ふーばー
ここで「hoge」や「ほげ」、「true」「false」なんてものを抜き出したい。
またtag1, tag2が仕様どおりであるかどうかのチェックもしたい。
DOMで考えるのが1番なんだろうか。
ちょっと久しぶりすぎてなんとも・・・。
できりゃ簡単にすいだせると便利なんだけどなぁ。
とりあえず週末までの宿題。
SAXとかが簡単そうにみえる(使ったことないけど)。
返信削除Javaのバージョンが古いと標準で入ってないみたいだけど。
DOM/SAXともに前の仕事でつかってたので内容は分かる!
返信削除DOMはたしか完全なXMLじゃないとだめなんだよねぇ。
Saxは前から順番にみていくだけだからいけそうかなぁと思っている。
まだやってないんだけど(笑)。
Perlのが美しくできそうだけど・・・さてさて。
結論からいうと正規表現で処理。
返信削除