さすがにPlaggerでもこれは無理だと思いたい。PythonでYahoo!Booksのランキングをとってくる。 というエントリを見て、なんか釣りっぽいタイトルだけど敢えて釣られてみた。
ちょっとアウトプット違うけど、Plagger なら 10 分でできた。
以下の2つのファイルを用意してやるだけ。
config.yaml
plugins: - module: Subscription::Config config: feed: - url: http://books.yahoo.co.jp/ranking/general/all/all/weekly/index.html meta: follow_link: /book_detail/.* - module: CustomFeed::Simple - module: Filter::EntryFullText - module: Publish::Gmail config: mailto: xxx@gmail.com mailfrom: plagger@mizzy.org mailroute: via: smtp host: localhost attach_enclosures: 1
EntryFullText 用 yaml
author: Gosuke Miyashita handle: http:\/\/books\.yahoo\.co\.jp\/book_detail\/\d+ extract: <!-- 書籍紹介 -->.+<small>(.*?)</small>.+<!-- //書籍紹介 --> extract_capture: body
既存の設定からほぼコピペなので、10 分のうち7割ぐらいは、EFT 用 yaml の文字コードが UTF-8 じゃないといけないのに、euc-jp にしてて「なんかうまくいかねー」とかやってた時間。