개인프로젝트/사용법 및 환경설정

아스키코드(ASCII), 유니코드(Unicode) 바이트 계산

길개발 2023. 1. 18. 10:29

 
 

1. 아스키코드(ASCII)

- 키보드로 직접 타이핑할 수 있는 문자들을 의미(공백" "도 포함)
 

1) 영문자, 숫자, 반각문자 등

* 반각문자(반자)
> 문자 인코딩 방식의 일종이며 기본적으로 영어, 숫자, 기호, 공백 등이 반각으로 표현됨(1문자의 1바이트)

- 1바이트(Byte), 8비트(bit)
 

2) 한글, 한자(표의문자) 등

* 표의문자
> 하나하나의 글자가 언어의 음과 상관없이 일정한 뜻을 나타내는 문자
> 고대의 회화 문자나 상형 문자가 발달한 것으로 한자가 대표적
- "가나다라 國家" 이런 한글이나 한자의 경우, 1글자는 2바이트(16비트)
 
 

2. 유니코드(Unicode)

- 전세계 모든 문자를 한꺼번에 표현할 수 있는 다국어 인코딩 방식
- 유니코드의 인코딩 방식은 UTF-8
 

1) 영문자, 숫자, 반각문자 등

- 영문이나 숫자는 여전히 1바이트
 

2) 한글, 한자(표의문자) 등

- 한글이나 한자가 3바이트
 
 
 
 
http://mwultong.blogspot.com/2008/03/1-char-byte.html

 

한 문자는 몇바이트? 1글자는 몇 바이트 비트 용량? 텍스트파일, 아스키, 유니코드에서; Char Byte

 

mwultong.blogspot.com