iconvでARIB つづき

ずーっと、ありぶ だと思ってたんだけど、あらいぶ なのかー。。。
とりあえずエラーが出ない程度には変換できるようになった。epgdumpではALPHABETを全角にマッピングしてたけど、全角英数字は見た目が嫌いなので、普通にASCIIに。proportionalとか言われても、それはiconvの仕事じゃないよね、ということで無視。
問題は追加記号。ぐぐってひっかかったこの辺り
https://sites.google.com/site/unicodesymbols/Home/japanese-tv-symbols/arib-unicode-mapping-table
のテーブルを使ってみたのだけど、出力を比べると、まったくおかしいことに気付いた。
新番組の [新] (ほんとは囲み文字)は、90区75点で、上の定義だとマッピング先は U+1F227 になっている。ところがどっこい。大本山
http://www.unicode.org/charts/
から、Enclosed Ideographic Supplement の中を見てみると、少なくとも目で見る限りは、U+1F21F だよな。。。draftの時点でU+1F227だったけど、後で割り当て直されたとか?
他の文字もずれまくっていて、まあこれは修正してやればいい(面倒だけど)としても、普通U+1F21Fなんてものを表示できるわけない。変換結果として正しくても、実際は役に立たないよなあ。とはいえiconvの仕様的には、内部コードUCS4と外部コードとを相互変換するものだから、epgdumpみたいに [ + 新 + ] の3文字にするのは、wctombの方の仕事だよなあ。ぐー。
考えてもしょうがないのでとりあえず、iconv的には正しいUCS4を持たせたんだから、後は時代が(フォントが)追い付いてくるのを待つことにしよう。。。