文字コード

Unicodeと日本語関連の文字種規格

イメージ図 なお、図中の幅にあまり意味は無いです (あくまでも覚えやすさを重視した概念図です) 図中の線の間隔幅に漢字登録数などの意味は無いです(覚えさすさ重視) 補足説明 Unicodeは、JIS第一~四水準漢字や、IBM拡張文字等に加え、外字も含め全てサポ…

英字キーボードの配列

AndroidにThinkPadキーボード繋ぐと、英字キーボードに認識してよく困るので作成した。 (しかしながら、最近繋いだらきちんと日本語キーボードで認識してくれた) 赤色塗ってる箇所が日本語キーボードと異なる箇所記号が異なる箇所一覧なお、自作した画像なの…

P171 文字列とUnicode

const str = "リンゴ"; const codePoints = convertCodePoints(str); console.log(codePoints); // ["30ea", "30f3", "30b4", "1f34e"] const codeUnits = covertCodeUnits(str); console.log(codeUnits); // ["30ea", "30f3", "30b4", "d83c", "df4e"] ・Un…

MySQLのutf8mb4とUTF-16のサロゲートペア

機能概要 MySQL utf8mb4 utf8は過去の歴史的経緯から1文字を表すための文字列長が1~3バイトの時代から1~4バイトになっている。(※1) MySQLも'utf8'は1~3バイトのutf-8しか保存できない。 4バイト以上を格納する場合はutf8mb4を文字コードに設定する必要が…