ワリとあっさりデキてしまった自作RSS生成スクリプト

2004/03/17

・関連するblog: CK [Headline-Readerの登録ユーザになってみる]
で、c-netやスラッシュドットはRSSで読めるものの、ITmediaやImpress系は
RSS配信をしていないので読めない、というお話をしました。その記事に
・関連するblog: はおりさん [RSS非対応のサイトを巡回してRSS表示してくれるサイト]
というトラックバックを、はおりさんから頂きました。MyRSSというサイトで
指定したサイトのRSSを自動生成してくれるというサービスで、
無料登録をすれば10サイトまで自動的にRSSを生成してくれます。
仕組みは簡単で、MyRSSは「テキストリンク」があると
それを記事だと思ってRSSを生成するようになっているのです。
 
実際にITmediaやImpressを登録して試してみると、ざざーっと記事のリストが
取れるようになります。「おおっ」と思いつつも、目を凝らしてよく見ると、
 
 「テキスト広告も拾っちゃってる・・・」 (´・ω・`)
 
だいたい、全体の2~3割がテキスト広告でした。
せめて異なるドメインへのリンクは除外して欲しかったと思いますが、
これはこれで、RSS配信のないサイトをチェックするのには便利だと思います。
 
さて、ここまで試してみて、ふと気がつきました。
 
 自分でRSSを作ればいいのでは? (・ω・)
 
ITmediaのページを読み込んで、記事へのリンクを拾い出し、RSS形式に
ぽこぽこ埋め込んでいけば、それでMyRSSと同じことができるハズです。
MyRSSのように「どんなサイトでも」というワケにはいきませんが、
逆に例えばITmediaの構成に特化した処理なども入れられます。
というわけで、ITmediaの「記事一覧」のページをハックして、
上位50記事をRSSにするPerlスクリプトを書いたら、
 
 うはは、案外あっさり出来た!
 
Headline-Readerであっさり認識してくれました(≧▽≦)o"
時間があればImpress系のサイトもトライしてみようかと思っています。
 
しかしこの勝手に生成したRSSって、私的利用以外はちょっとマズそうですね・・・。


2004/03/17 [updated : 2004/03/17 16:57]


この記事を書いたのは・・・。
CK@デジモノに埋もれる日々 @ckom
ブログ「デジモノに埋もれる日々」「アニメレーダー」「コミックダッシュ!」管理人。デジモノ、アニメ、ゲーム等の雑多な情報をツイートします。




« 小さな破片をピタッと拾えます

トップに戻る

J-COMのデジタル放送開始と録画の関係(回答編) »


▼ はてなブックマークのコメント ▼



2024年のご挨拶


全力Vの1年:2023年振り返り~2023年も大変お世話になりました。2024年も宜しくお願いいたします。


2023年あけましておめでとうございます。デジモノに埋もれる様子をお届けできない日々


"V"にハマった1年:2022年振り返り~2022年も大変お世話になりました。2023年も宜しくお願いいたします。


(状況のご報告)Twitterアカウントの状況について ※2022.11.08追記あり


連投メモ:「ツイートで『ブログ』を書く」お話と、ガジェット系からイベントレポ系に遷移していった時のお話


2022年あけましておめでとうございます。よろず話はカーナビの「ジャイロ」ご乱心のお話


2021年も大変お世話になりました。2022年も宜しくお願いいたします。


2021年あけましておめでとうございます。よろず話はレンタカーと「一脚」テスト。


2020年も大変お世話になりました。2021年も宜しくお願いいたします。


2020年あけましておめでとうございます。今年はちゃんと歯を磨きます。。。


2019年も大変お世話になりました。2020年も宜しくお願いいたします。

ピックアップタグ




ブログ内検索



▼ コメント ▼


★コミックダッシュ! 10,000人突破ありがとうキャンペーン!(9/18~10/23)
 
デジモノに埋もれる日々 : (C) CKWorks