M.C.P.C.

―むり・くり―プラスコミュニケーション(更新終了)


| トップページ |

2008年12月21日 23:11

AdobeのページからScrapeするやり方、またはAdobe Support - サービスデータベース -のRSS

このエントリーをはてなブックマークに追加 mixiチェック

M.C.P.C.: アドビは新ソフト発売時デフォルト値を公表しておいてもらえるとありがたい:Comment

本エントリと直接関係ない話ですみません。どこに書き込んでよいか分からなかったもので。
実はRSSを作成してもらえないかなあ、という依頼です。
ページは「Adobe Support - サービスデータベース -」http://support.adobe.co.jp/faq/faq/cfaqindex.sv です。最近CS4の発売が近いせいか、結構重要な記事が登録されています。
Webのほうはからっきしなので、可能かどうかすら分からないのですが、もしできましたらお願いします。

投稿者: お~まち (2008/12/19 7:36:25)

Webの情報が欲しいと思ったときに自分で作れた方がいいと思うので、今回やったことを書きます。

※FireBug、PerlのWeb::Scraperを導入しておく

1.FireBugでXPathを取得

Adobescrape01s
▲FireBugでの操作①:FireBug起動から要素取得まで

Adobescrape02
▲FireBugでの操作②:要素からXPath取得まで

上記をやってクリップボードにコピーされたのが、

/html/body/table[5]/tbody/tr[3]/td[2]/table/tbody/tr[2]/td/table/tbody/tr/td[3]/span/a

となります。

これからtbodyを抜き取っておく。

/html/body/table[5]/tr[3]/td[2]/table/tr[2]/td/table/tr/td[3]/span/a

2.Web::Scraperのコマンドラインで取得してみる

詳しくはhttp://e8y.net/mag/013-web-scraper/を参照。

さっき取得したXPathを使ってゲットできるかどうか確認。

Adobescrape03
▲失敗例

試行錯誤した結果、最初のtableが一つずれていたので、

× /html/body/table[5]/tr[3]/td[2]/table/tr[2]/td/table/tr/td[3]/span/a
○ /html/body/table[4]/tr[3]/td[2]/table/tr[2]/td/table/tr/td[3]/span/a

でやってみる

Adobescrape04
▲成功!

こんな感じで、RSSを作る材料を用意します。

~~~

ここまでやって、

M.C.P.C.: アドビサポートデータベース新着RSSと、ソフトアンテナのRSSの自動生成を作りました。

のアドビサポートデータベース新着RSS生成プログラムがほぼ流用できることがわかったので、さっきまでやったのを全部捨てて、流用して出来たのがこちら。

Adobe Support - サービスデータベース -

お使いください。

投稿 大野 義貴 [DTP] | |

トラックバック(1)

トラックバックURL: http://blog.dtpwiki.jp/MTOS/mt-tb.cgi/2701

昨日書いたAdobeサイト改変の件をうけて、当サイトで提供していたRSSフィード、 Adobe Support - サポートデータベース Adobe Support - サービスデータベース の更新を終了しました。 そんなら代わりのもはないの?ていうわけですが、ただいまAdobeの日本サイトが絶賛改変中でありまして、ところどころのページにRSSフィードが埋め込まれていたりいなかったりしますので(USサイトを見て推測すればアドレスがわかる)、いずれ日本サイトにも付くんだと思います。 それまで待てない場... 続きを読む

コメント(1)

Firebugを入れるのも良いですが Find XPath http://xpath.kayac.com/help のほうがより綺麗なXPathが手軽に取り出せるのでオススメです。

コメントする