AdobeのページからScrapeするやり方、またはAdobe Support - サービスデータベース -のRSS
スポンサードリンク
M.C.P.C.: アドビは新ソフト発売時デフォルト値を公表しておいてもらえるとありがたい:Comment
本エントリと直接関係ない話ですみません。どこに書き込んでよいか分からなかったもので。
実はRSSを作成してもらえないかなあ、という依頼です。
ページは「Adobe Support - サービスデータベース -」http://support.adobe.co.jp/faq/faq/cfaqindex.sv です。最近CS4の発売が近いせいか、結構重要な記事が登録されています。
Webのほうはからっきしなので、可能かどうかすら分からないのですが、もしできましたらお願いします。
投稿者: お~まち (2008/12/19 7:36:25)
Webの情報が欲しいと思ったときに自分で作れた方がいいと思うので、今回やったことを書きます。
※FireBug、PerlのWeb::Scraperを導入しておく
1.FireBugでXPathを取得
▲FireBugでの操作①:FireBug起動から要素取得まで
▲FireBugでの操作②:要素からXPath取得まで
上記をやってクリップボードにコピーされたのが、
/html/body/table[5]/tbody/tr[3]/td[2]/table/tbody/tr[2]/td/table/tbody/tr/td[3]/span/a
となります。
これからtbodyを抜き取っておく。
/html/body/table[5]/tr[3]/td[2]/table/tr[2]/td/table/tr/td[3]/span/a
2.Web::Scraperのコマンドラインで取得してみる
詳しくはhttp://e8y.net/mag/013-web-scraper/を参照。
さっき取得したXPathを使ってゲットできるかどうか確認。
▲失敗例
試行錯誤した結果、最初のtableが一つずれていたので、
× /html/body/table[5]/tr[3]/td[2]/table/tr[2]/td/table/tr/td[3]/span/a
○ /html/body/table[4]/tr[3]/td[2]/table/tr[2]/td/table/tr/td[3]/span/a
でやってみる
▲成功!
こんな感じで、RSSを作る材料を用意します。
~~~
ここまでやって、
M.C.P.C.: アドビサポートデータベース新着RSSと、ソフトアンテナのRSSの自動生成を作りました。
のアドビサポートデータベース新着RSS生成プログラムがほぼ流用できることがわかったので、さっきまでやったのを全部捨てて、流用して出来たのがこちら。
お使いください。
スポンサードリンク
トラックバック(1)
トラックバックURL: http://blog.dtpwiki.jp/MTOS/mt-tb.cgi/2701
昨日書いたAdobeサイト改変の件をうけて、当サイトで提供していたRSSフィード、 Adobe Support - サポートデータベース Adobe Support - サービスデータベース の更新を終了しました。 そんなら代わりのもはないの?ていうわけですが、ただいまAdobeの日本サイトが絶賛改変中でありまして、ところどころのページにRSSフィードが埋め込まれていたりいなかったりしますので(USサイトを見て推測すればアドレスがわかる)、いずれ日本サイトにも付くんだと思います。 それまで待てない場... 続きを読む
Firebugを入れるのも良いですが Find XPath http://xpath.kayac.com/help のほうがより綺麗なXPathが手軽に取り出せるのでオススメです。