M.C.P.C.

―むり・くり―プラスコミュニケーション(更新終了)


| トップページ |

2011年3月20日 22:15

換字暗号とかじゃなくてフォントのカスタムエンコーディングだと思う

このエントリーをはてなブックマークに追加 mixiチェック

データは自動処理可能な形で提供してほしい | Okumura's Blog [oku.edu.mie-u.ac.jp]

特にひどかったのは「平成23年3月19日(土曜日)13時00分版」というPDFファイルで,MacのPreviewでうまく数値が取り出せないのでAdobe Readerで開くとファイル名の横に「(保護)」と出る。コピペすると "*"#( といった記号の列になる。幸い,単純な換字暗号であり,次のUNIXコマンドで復号することができた。

tr "*\"!#$%&'()\037" ".0123456789"

文科省はわれわれがデータを取り出して再利用していることを快く思わなかったのかと邪推したが,より新しいデータはコピー可能に戻ったので,単なる保存ミスだったのかもしれない。

PDFにMS PゴシックをTrueTypeからType1に変換してフォントエンベッドするときにフォントのエンコーディングがカスタムエンコーディングとなる例ってよくあったよねーとか思った。

Pdfcustomencs
▲カスタムエンコーディング

大抵カスタムエンコーディングになった場合は、出現順で文字コードとグリフが割り当てられるんですよね。結果的には換字暗号になっているけれども。

すごい昔の記憶だとWindows 95系のプリンタドライバでフォントの送信方式をアウトラインにしたときにこうなるんだったような記憶があるよ。いまどきのドライバでどうすればこういう設定になるかわかんないや。

投稿 大野 義貴 [PDF] | |

トラックバック(0)

トラックバックURL: http://blog.dtpwiki.jp/MTOS/mt-tb.cgi/3531

コメントする