にじさんじ
最初の文字は文字エンコーディングです。2ビット文字は上位4ビット文字または下位3ビット文字としてエンコードされます。 2ビット文字エンコーディングは通常UCS-2と呼ばれます。 UCS-2はオリジナルのUnicodeのサブセットです。 すべての文字は、その順序に関係なく、同じ方法でコード化されます。しかし、ユニコード標準は従来のUCS-2文字セットよりもはるかに複雑で、そのため新しい文字セットが必要になりました。 この新しい文字セットがUnicode Standardです。 この文書では、新しい文字セットについて説明し、それがどのように文字のエンコーディングを定義するかを説明します。 新しい文字セットはUnicode Standardで定義されています。 文字エンコーディング」も参照してください。 この文書で定義される文字は、文字エンコーディングの分類に使用される規則に従って、Unicode文字として分類されます。 1 この文書は、文字エンコーディングの経験があり、情報技術、コンピュータサイエンス、コンピュータ産業の一般的な理解を持つ人々を対象としている。 2 この文書は、ユニコード・コンソーシアムが提供する文字符号化文書と混同してはならない。 3 この文書は、Unicode Technical Report 3.0 において文字セットがどのように定義されているかをまとめたものである