RSSフィードがないウェブページの更新を把握したいので、RSSを勝手に作ってみた。カスタムRSSを作ってくれる同様のサービスをいくつか試してみたが、一番きめ細かく使えそうなFeed43.comを利用してみた。
具体的に作ってみたのは、経済産業省の審議会・研究会等の開催案内。
以下は、設定した結果。何とかうまく動いているみたいなので、メモしておく。
Step 1. Specify source page address (URL)
https://wwws.meti.go.jp/interface/honsho/committee/index.cgi/committee
Step 2. Define extraction rules
Global Search Pattern:
<tbody>{%}</tbody>
Item (repeatable) Search Pattern*:
<tr>
{*}scope=”row”>
{%}<br />
{*}”committee_icon_shingikai”>{%}</div>
{*}href=”{%}”>{%}</a>
{*}<th class=”centerPosT” scope=”row”>
このSearch Patternを設定するところで、悩みました。
単純にHTMLタグをそのままコピペするだけではだめで、適当に削除して{*}を入れると上手くいくみたいです。
Step 3. Define output format
RSS feed properties
Feed Title*: [?]
開催案内-審議会・研究会(METI/経済産業省)
Feed Link*: [?]
https://wwws.meti.go.jp/interface/honsho/committee/index.cgi/committee
Feed Description*:
開催案内-審議会・研究会(METI/経済産業省)
この3つは自動的に記入されてました。
RSS item properties
Item Title Template*: [?]
({%2} 開催案内){%1} {%4}
Item Link Template*: [?]
{%3}
Item Content Template*: [?]
{%4}
これで、フィードができる。
自分はさらに全文RSSに変換。とりあえずしばらく様子を見て、大丈夫そうだったら、他のウェブページも試してみたい。
本当は、Feed43のサービスを自前で組めれば安心なのだが。
コメント