UTF-8変換ライブラリ

Version 2.0

2009/03/05

 Shift_JIS/ISO-2022-JPとUnicodeのUTF-8の相互変換ができるPerlライブラリです。Macromedia Flash Playerと連携したCGI作りに必要になって、簡単に使えるものがなかったので作ってみました。Perl 5.6以降で使用可能です。複数の変換表を取り入れることで他のプログラムで変換されたものもある程度問題なく扱えるようになっています。
 ISO-2022-JPへの変換時はIBM拡張→NEC選定、半角カタカナ→全角カタカナに変換します。

 これは単体で使うものではなく、他のスクリプトに組み込んで使用するものです。

ダウンロード
utf_conv2.zip 62.6kB

特徴

 上にも書いていますがこのライブラリは複数の変換ルールを持っています。たとえばUnicode→Shift_JISの場合
  0x5c (REVERSE SOLIDUS)と0xa5 (YEN SIGN)はともに0x5c「\」に、
  0xff5e (FULLWIDTH TILDE)と0x301c (WAVE DASH)はともに0x8160「〜」に変換されます。

使用にあたって

使用したいPerlスクリプトと同じディレクトリにtsutf8.plとutf.ltsを置いて
require 'tsutf8.pl';
と書いてください。
具体的な使用方法はtsutf8.pl内のコメントを見てください。

別のディレクトリに設置した場合はライブラリを読み込んだ後に$Kicode::clの値を書き換えてください。($Kicode::cl = 'lib/utf.lts'; という感じで)

そのほか

use strict; を使用した状態での動作は保証しません。

WAVE DASHの扱い方をどうしようか・・とおもったけどそのまんまWAVE DASHにすると表示がやや変なのでCP932の通りにしました。

変換ルールを詳しく知りたい&変更したいという人はこのファイルをどうぞ。

更新履歴

2009.03.052.0ISO-2022-JPに対応、複数の変換ルールを実装、一部の記号が正しく扱えなかったのを修正
2007.01.151.0公開