Version 2.0
Shift_JIS/ISO-2022-JPとUnicodeのUTF-8の相互変換ができるPerlライブラリです。Macromedia Flash Playerと連携したCGI作りに必要になって、簡単に使えるものがなかったので作ってみました。Perl 5.6以降で使用可能です。複数の変換表を取り入れることで他のプログラムで変換されたものもある程度問題なく扱えるようになっています。
ISO-2022-JPへの変換時はIBM拡張→NEC選定、半角カタカナ→全角カタカナに変換します。
これは単体で使うものではなく、他のスクリプトに組み込んで使用するものです。
上にも書いていますがこのライブラリは複数の変換ルールを持っています。たとえばUnicode→Shift_JISの場合
0x5c (REVERSE SOLIDUS)と0xa5 (YEN SIGN)はともに0x5c「\」に、
0xff5e (FULLWIDTH TILDE)と0x301c (WAVE DASH)はともに0x8160「〜」に変換されます。
require 'tsutf8.pl';
use strict; を使用した状態での動作は保証しません。
WAVE DASHの扱い方をどうしようか・・とおもったけどそのまんまWAVE DASHにすると表示がやや変なのでCP932の通りにしました。
変換ルールを詳しく知りたい&変更したいという人はこのファイルをどうぞ。
2009.03.05 | 2.0 | ISO-2022-JPに対応、複数の変換ルールを実装、一部の記号が正しく扱えなかったのを修正 |
2007.01.15 | 1.0 | 公開 |