はしご高

ウェブシステムに一括で取り込ませるデータを確認していたら、「はしご高*1」があった。この辺とあと数文字、文字コード変換からこぼれて文字化けするものがある。
linuxのiconvとか結構綺麗に変換してくれた*2が、それでもはしご高の処理はうまくいかなかった。
正直、コンピュータに読ませるときにはこういう異体字は厳しい。
でもなぜかWebから直接対話で入力すると問題なく読み込める書き込めるので、取り込みプログラムのパーツのどれかが適切でないコード処理をしているのだろう。これ以上の解析は投げた(笑)

*1:「高」の上側の口の左右の縦棒が上下に接するまで伸びる。高校の大半ははしご高の方を使って名前を表記しているような。

*2:変換元をsjis-win、変換先をeuc-jp-msにしなければならなかったが。sjis-winは分かるがeuc-jp-msは何者か分からないなぁ。検索するとちょっとは出てくるが。