Unicodeと日本語関連の文字種規格

イメージ図

なお、図中の幅にあまり意味は無いです
(あくまでも覚えやすさを重視した概念図です)

図中の線の間隔幅に漢字登録数などの意味は無いです(覚えさすさ重視)

補足説明

  • Unicodeは、JIS第一~四水準漢字や、IBM拡張文字等に加え、外字も含め全てサポートする。
  • JIS第三~四水準漢字はUnicodeで表現できるが、それがサロゲートペア文字である場合もある。
  • JISの漢字規格もいくつか種類があるので、ややこしさの原因の一因である。
  • JIS第一~四水準漢字に含まれない漢字(例:𠮷[つちよし、牛丼屋の吉])も存在する。JIS規格外漢字がサロゲートペアである場合もあれば、そうでない場合もある。
  • IBM拡張文字も第三水準や第四水準と被る部分も存在する。しかし、被らない(JIS規格外)漢字(例:髙[はしごだか])も存在する。但し、サロゲートペア文字の範囲には現れない。
  • 外字は私用領域で登録する必要があり、どの規格とも被らない。(被るのであれば、わざわざ外字登録する必要がないため)

リアルタイム文字コード解析ツール

本当にこんなサイトが昔から欲しかった
www.natade.net