문자셋 UTF-8과 EUC-KR

우리나라의 경우 웹페이지에 사용되는 문자셋은 크게 euc-kr 과 utf-8 정도가 있습니다.

EUC-KR은 2350개의 한글문자, 한국에서 통용되는 한자 그리고 영문을 표현할 수 있습니다. 문서를 작성할때 한정된 범위내의 문자만을 사용할 경우 사용합니다. 한글 한 자를 2Byte로 처리합니다.

UTF-8은 유니코드입니다. 유니코드는 전세계의 모든 문자를 표현할 수 있는 인코딩입니다. 한글이라고는 구경해 본 적도 없는 세계 방방 곳곳의 어느 컴퓨터에서도 우리가 작성한 한글을 문제 없이 표현할 수 있다는 것입니다. 다만 한글 한 자를 3Byte로 처리하기 때문에 문서가 다소 커질수가 있으나, 공백이나 영문 한 자는 1Byte로 처리하는 유연함을 보여 줍니다.

문자셋을 UTF-8로 작성한다면 HTML 파일을 저장할 때 파일 타입도 UTF-8로 저장해야 합니다.

XHTML에서 문자셋 지정은 아래와 같습니다.

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

HTML 5에서 문자셋 지정은 더욱 간편합니다.

<meta charset="UTF-8">

유니코드는 국제적인 코드 규약입니다. 미래 지향적인 사이트를 만들려면 외국에서도 문제가 없는 문자셋을 지정하는게 여러모로 유리하겠지요. 멜랑꼴리한 외계어를 보기 싫다면 말이죠. ^^

'웹코딩 > HTML' 카테고리의 다른 글

[HTML5] 1장 HTML5를 시작하기 전에... (0)	2013.02.04
관용모드와 표준모드 - Quirks mode & Standard mode (0)	2012.11.27
X-UA-Compatible, IE=edge, 호환성 보기 (3)	2012.11.26
XHTML 기본구조 (0)	2012.11.26
XHTML 1.0 (0)	2012.11.26

WEBDIR