映画.comから映画の情報を取得するコードを書いてみます。
WebスクレイピングとはWebサイトのHTMLデータを収集して、特定のデータを抽出・整形することです
MechanizeはWebサイトとの対話を自動化するためのライブラリです。 ここでは、ログインのためのフォーム入力、ページ遷移しての処理を Mechanizeのインスタンスで行っています。
NokogiriというかXPathの検索方法です。idやclassなどの属性値で検索することが多いですが、実は属性値であれば、 なんでも使えます。属性値検索の場合は、[]で指定します。@部分が属性値の名前です。
gem install nokogiri -- --with-xml2-include=/Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.11.sdk/usr/include/libxml2 --use-system-libraries