日本の印刷屋さんのウェブサイトの文字コード(エンコーディング)を調べました。
対象は、2011年1月現在、日本を代表する印刷屋さんが掲載されている
Adobe Creative Suite 出力対応店一覧 [www.adobe.com]
から、CS5対応店となっている企業のうち、URLを持っているところです。
手法は、下記の様な
use strict;
use warnings;
use LWP::Simple;
my @urls = (
'http://www.suda.co.jp/',
'http://www.syoubunsya.co.jp/',
'http://www.makasete.jp/',
'http://www.hoeido.co.jp/',
'http://www.technical.co.jp',
'http://www.dnp.co.jp/about/operation.html',
'http://www.toppan.co.jp/index.html',
'http://www.kyodoprinting.co.jp/',
'http://www.lithmatic.net/',
'http://www.medio-pr.co.jp/',
'http://www.insatsu-tsuhan.co.jp',
'http://www.nik-prt.co.jp/',
'http://www.central-p.co.jp',
'http://www.arcdtp.co.jp/',
'http://www.sannichi-p.co.jp/',
'http://www.cybig.net/',
'http://www.sankyo-g.co.jp/',
'http://www.shimazu-pnet.co.jp/',
'http://www.ddc.co.jp/index.html',
'http://www.yppnet.co.jp/index.html',
'http://www.sannichi-p.co.jp/',
'http://maedaco.web.fc2.com',
'http://www.gifuseihan.co.jp/',
'http://www.dpg.co.jp/',
'http://www.m-print.co.jp/',
'http://www.toyo-printing.com/',
'http://www.taiho-pp.net/',
'http://www1.ocn.ne.jp/~andprint/',
'http://www.aoi-g.co.jp/',
'http://www.graphic.jp/',
'http://www.mbi.co.jp/',
'http://www.digitech-j.com/',
'http://www.ksinet.co.jp',
'http://www.shinwa-printing.co.jp',
'http://www.marupri.jp',
'http://www.yubun.co.jp/',
'http://www.it-color.com',
'http://www.maincolor.co.jp/',
'http://www.lc-ksp.co.jp/',
'http://gsy.ryohin-insatsu.com/',
'http://www.yoshipro.co.jp',
'http://www.d-igi.com/',
'http://www.zpx.co.jp/',
'http://dai1.com/',
'http://www.kugiya.net/index.html',
'http://www.coara.or.jp/~sorinsha/',
);
for my $url ( @urls ) {
my $html = get ( $url );
if ( $html =~ m/charset=([^>]+)/imo) {
( my $charset = $1 ) =~ s|[\s"/]||g;
print "$charset\t $url\n";
}
}
exit;
__END__
というとても親しみのあるコードで実際に各企業様のページを取得し、charsetのところを収集しました。