P103 【iconv -c】不正文字存在チェック及び除去

概要

iconvの用途は文字コード変換に用いることが主目的である。
しかし、-cというオプションを指定すると、その文字コードに許されていない文字を削除できる。

実行結果例

「こん」のあとにUTF-8として不正な0xffを埋め込む
echo -e 'こん\xffにちわ' | iconv -f UTF-8 -t UTF-8
位置 6 に不正な入力シーケンスがあります
上記に-cオプションを付けてやる
echo -e 'こん\xffにちわ' | iconv -c -f UTF-8 -t UTF-8
こんにちわ