換字暗号とかじゃなくてフォントのカスタムエンコーディングだと思う
スポンサードリンク
データは自動処理可能な形で提供してほしい | Okumura's Blog [oku.edu.mie-u.ac.jp]
特にひどかったのは「平成23年3月19日(土曜日)13時00分版」というPDFファイルで,MacのPreviewでうまく数値が取り出せないのでAdobe Readerで開くとファイル名の横に「(保護)」と出る。コピペすると "*"#( といった記号の列になる。幸い,単純な換字暗号であり,次のUNIXコマンドで復号することができた。
tr "*\"!#$%&'()\037" ".0123456789"
文科省はわれわれがデータを取り出して再利用していることを快く思わなかったのかと邪推したが,より新しいデータはコピー可能に戻ったので,単なる保存ミスだったのかもしれない。
PDFにMS PゴシックをTrueTypeからType1に変換してフォントエンベッドするときにフォントのエンコーディングがカスタムエンコーディングとなる例ってよくあったよねーとか思った。
大抵カスタムエンコーディングになった場合は、出現順で文字コードとグリフが割り当てられるんですよね。結果的には換字暗号になっているけれども。
すごい昔の記憶だとWindows 95系のプリンタドライバでフォントの送信方式をアウトラインにしたときにこうなるんだったような記憶があるよ。いまどきのドライバでどうすればこういう設定になるかわかんないや。
スポンサードリンク
トラックバック(0)
トラックバックURL: http://blog.dtpwiki.jp/MTOS/mt-tb.cgi/3531
コメントする