2007年10月18日木曜日

Javaでの取り扱い調査

Javaで文字列処理のお話。
タグ中の中身やら属性やら、タグが正しいかどうかというチェックするような
メソッドやらライブラリやらなかったかな。
知ってる方、教えてください(まぁ自分でも調べますが)。
Hoge <tag1 attr="true">hoge</tag1> foo bar
ほげ<tag2 attr="false">ほげ</tag2>ふーばー
ここで「hoge」や「ほげ」、「true」「false」なんてものを抜き出したい。
またtag1, tag2が仕様どおりであるかどうかのチェックもしたい。
DOMで考えるのが1番なんだろうか。
ちょっと久しぶりすぎてなんとも・・・。
できりゃ簡単にすいだせると便利なんだけどなぁ。
とりあえず週末までの宿題。

3 件のコメント:

  1. SAXとかが簡単そうにみえる(使ったことないけど)。
    Javaのバージョンが古いと標準で入ってないみたいだけど。

    返信削除
  2. DOM/SAXともに前の仕事でつかってたので内容は分かる!
    DOMはたしか完全なXMLじゃないとだめなんだよねぇ。
    Saxは前から順番にみていくだけだからいけそうかなぁと思っている。
    まだやってないんだけど(笑)。
    Perlのが美しくできそうだけど・・・さてさて。

    返信削除
  3. 結論からいうと正規表現で処理。

    返信削除