文字コード

Unicodeと日本語関連の文字種規格

【イメージ図】 なお、図中の幅にあまり意味は無いです (あくまでも覚えやすさを重視した概念図です) 図中の線の間隔幅に漢字登録数などの意味は無いです(覚えさすさ重視)【補足説明】 ・Unicodeは、JIS第一~四水準漢字や、IBM拡張文字等に加え、外字も含め…

英字キーボードの配列

AndroidにThinkPadキーボード繋ぐと、英字キーボードに認識してよく困るので作成した。 (しかしながら、最近繋いだらきちんと日本語キーボードで認識してくれた) 赤色塗ってる箇所が日本語キーボードと異なる箇所記号が異なる箇所一覧なお、自作した画像なの…

P171 文字列とUnicode

const str = "リンゴ"; const codePoints = convertCodePoints(str); console.log(codePoints); // ["30ea", "30f3", "30b4", "1f34e"] const codeUnits = covertCodeUnits(str); console.log(codeUnits); // ["30ea", "30f3", "30b4", "d83c", "df4e"] ・Un…

MySQLのutf8mb4とUTF-16のサロゲートペア

【機能概要】 ・MySQL utf8mb4 utf8は過去の歴史的経緯から1文字を表すための文字列長が1~3バイトの時代から1~4バイトになっている。(※1) MySQLもutf8は1~3バイトのutf-8しか保存できないため、4バイトになる様な文字コードを格納する場合は、utf8mb4にす…