RSSフィードがないウェブページのカスタムRSSの作成

RSSフィードがないウェブページの更新を把握したいので、RSSを勝手に作ってみた。カスタムRSSを作ってくれる同様のサービスをいくつか試してみたが、一番きめ細かく使えそうなFeed43.comを利用してみた。

具体的に作ってみたのは、経済産業省の審議会・研究会等の開催案内。

以下は、設定した結果。何とかうまく動いているみたいなので、メモしておく。

Step 1. Specify source page address (URL)

https://wwws.meti.go.jp/interface/honsho/committee/index.cgi/committee

Step 2. Define extraction rules

Global Search Pattern:

<tbody>{%}</tbody>

Item (repeatable) Search Pattern*:

<tr>
{*}scope=”row”>
{%}<br />
{*}”committee_icon_shingikai”>{%}</div>
{*}href=”{%}”>{%}</a>
{*}<th class=”centerPosT” scope=”row”>

このSearch Patternを設定するところで、悩みました。

単純にHTMLタグをそのままコピペするだけではだめで、適当に削除して{*}を入れると上手くいくみたいです。

Step 3. Define output format

RSS feed properties

Feed Title*: [?]

開催案内-審議会・研究会(METI/経済産業省)

Feed Link*: [?]

https://wwws.meti.go.jp/interface/honsho/committee/index.cgi/committee

Feed Description*:

開催案内-審議会・研究会(METI/経済産業省)

この3つは自動的に記入されてました。

RSS item properties

Item Title Template*: [?]

({%2} 開催案内){%1} {%4}

Item Link Template*: [?]

{%3}

Item Content Template*: [?]

{%4}

これで、フィードができる。

自分はさらに全文RSSに変換。とりあえずしばらく様子を見て、大丈夫そうだったら、他のウェブページも試してみたい。

本当は、Feed43のサービスを自前で組めれば安心なのだが。

スポンサーリンク
レクタングル大
レクタングル大

シェアする

  • このエントリーをはてなブックマークに追加

フォローする