はてなアンテナをPlaggerで取得

主に絵師さんをアンテナに登録しているのですが、サイト毎にyaml書いてたらキリがないので、RSSからリンク先のHTMLを全文取得する試み。

config.HatenaAntenna.yaml

global:
 assets_path: assets/
 timezone: Asia/Tokyo
 log:
    level: debug

plugins:
  - module: Subscription::Config
    config:
      feed:
       -  http://a.hatena.ne.jp/user/rss

  - module: Filter::EntryFullText
    config:
      store_html_on_failure: 1

  - module: Filter::BreakEntriesToFeeds

  - module: Filter::ResolveRelativeLink

  - module: Filter::Rule
     rule:
      module: Deduped

  - module: Publish::Gmail
    config:
      mailto: hoge@gmail.com
      mailfrom: hoge+plagger@gmail.com
      mailroute:
       via: smtp_tls
       host: smtp.gmail.com:587
       username: hoge@gmail.com
       password: xxxxxx

一応解説

  - module: Filter::EntryFullText
    config:
      store_html_on_failure: 1

これでリンク先のHTMLを全文取得、

  - module: Filter::ResolveRelativeLink

相対リンクを修正して、

  - module: Filter::BreakEntriesToFeeds

エントリをサイト毎に分割する(コレがないと縦に長過ぎて悲惨な事になります)。

まあ、サイト毎にyaml書いた方が断然見やすいのですが、こういうこともできます…ということで。

はてなアンテナはグループごとのRSSも出力しているので、実際には「絵師さん」とかグループを作って、feedの所を

-  http://a.hatena.ne.jp/user/rss?gid=xxxxxx

とすると良いと思います。