P103 【iconv】不正文字存在チェック及び除去

iconvの用途は文字コード変換に用いることが主目的であるが、-cというオプションを指定すると、その文字コードに許されていない文字を削除するのに用いれる。

#「こん」のあとにUTF-8として不正な0xffを埋め込む
echo -e 'こん\xffにちわ' | iconv -f UTF-8 -t UTF-8
→位置 6 に不正な入力シーケンスがあります

# iconv -c で削除
echo -e 'こん\xffにちわ' | iconv -c -f UTF-8 -t UTF-8
→こんにちわ

シェルプログラミング実用テクニック (Software Design plus)

シェルプログラミング実用テクニック (Software Design plus)