3-2.情報に関する理論

(3)文字の表現

★ASCIIコード

現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード
7桁の2進数で表すことのできる整数の数値のそれぞれに、大小のラテン文字や数字、英文でよく使われる粗フォントを割り当てた文字コード

★EUC(Extended UNIX Code:拡張UNIXコード)

UNIX上で様々な文字を扱うための拡張仕様として策定されたマルチバイト文字の規格のこと
そのため、複数のバイト幅を用いて感じのような膨大な数の文字も扱うことが可能。日本語の場合はEUC-JPである

★JISコード

文字をどのように数値コードに対応させるかという符号化方式のこと
日本語の表現に対応

★シフトJISコード

JIXコードを1バイトコードに重ならないようにシフトしたもの

★Unicode

全世界共通で使えるように、世界中の文字を収録する文字コード規格
基本的にアルファベットや顔文字などの様々なものに対応している

★UCS

一般的にはUCS-2?
これも様々な言語の文字を収録した文字集合の規格の一つである。
ヨーロッパ諸国の言語やヘブライ文字、ハングルなど世界で日常的に使用される文字がほとんど収録されている


  • 最終更新:2017-08-16 21:30:40

このWIKIを編集するにはパスワード入力が必要です

認証パスワード