HTMLまわりの解析とかいろいろのライブラリ

HTMLを解析するのになんかいい方法ないかなぁ、と前に悩んでほったらかしにしてしまったのですが(だめエンジニア)、Hpricotでほとんど解決できそうっす。
参考にしたのはこのあたり
http://tam.qmix.org/wiki/Hpricot.html
Route 477


編集や検索もかなり強力にできる様子で今のところ不満はないっす。スピードも、、気になるところないけど、そんなにでっかいの扱ってないからちょっとわかんないですね。説明を見る限り速そうですが。


あと、「ウェブサイトへのアクセスの自動化」ができてしまうWWW::Mechanizeも面白そうですね。こっちはまだ全然動かしてみてないですが。

両方gemコマンドでインストールできます。

# Hpricot
gem install hpricot

# WWW::Mechanize
gem install mechanize