한글코드

1. 한글코드.hwp
2. 한글코드.pdf
한글코드
가. 한글 코드
컴퓨터는 내부적으로 정보를 처리하기 위해서 2진수 형태로 처리되기 때문에 문자를 직접적으로 처리할 수 없다. 이 때문에 컴퓨터가 문자를 처리할 수 있도록 2진수와의 대응 관계를 정의하였는데, 이것을 문자 코드라 한다. 따라서 한글 및 한국어(한자, 특수문자 등을 포함)를 컴퓨터 내부에서 2진수로 처리할 수 있도록 정의해 놓은 것이 한글 코드이다.


나. 한글 코드 개발의 필요성
널리 사용되는 ASCII 는 8bit로서 28(=256)개를 표현할 수 있다. 이는 28字의 영문자를 풀어쓰는 영․미 문화권에서는 불편함이 없지만, 자수(字數)가 많은 우리나라의 경우에는, 이를 사용하여 문자를 표현하는 것이 매우 곤란하다. 이 때문에 한글을 표현할 수 있는 한글 코드 체계의 개발이 절실히 필요하였다.

다. 국제 규격에 의한 제약
ISO는 ASCII(ISO-646)를 확장하여 2byte 이상 코드 체계를 사용할 때 지켜야 할 규격을 ISO-2022로 정의하고 있다. 이 규격에 따르면, 각 byte의 0~31(0x00~0x1F), 128~159(0x80~0x9F)는 제어 영역으로 문자를 할당할 수 없다. 또한 32(0x20)와 160(0xA0)은 공백(space)문자로, 127(0x7F)과 255(0xFF)는 삭제(delete)문자로 지정하고 있다. 아울러, 2byte 이상의 코드 체계인 경우 각 바이트의 MSB가 모두 동일할 것을 요구하고 있다. 기존 ASCII의 MSB가 0인 것을 감안한다면, MSB가 모두 1인 영역만을 사용할 수 있고, 즉 161~254(0xA1~0xFE)만을 한글 코드에 사용할 수 있는 셈이다.

1) 초성: 자음(14) + 쌍자음(5) = 19개
2) 중성: 자음(10) + 쌍자음(11) = 21개
3) 종성: 자음(14) + 쌍자음(11) + 쌍자음(2) = 27개
4) 받침 없는 글자: 초성(19) × 중성(21) = 399字