컴퓨터 구조
아스키코드와 유니코드
JiHxxn
2024. 7. 20. 17:54
🤔 아스키코드(ASCII)란?
ASCII (American Standard Code for Information Interchange, 미국 정보 교환 표준 부호)
- 아스키코드는 미국에서 정의한 표준화한 부호체계이며 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 가장 기본적인 부호 체계이다.
- 문자 당 1byte를 사용하는 특징이 있다.
- 아스키코드는 8비트 중 7비트 사용 나머지 1비트는 에러 검출을 위한 용도로 사용함.
- *65번과 97번은 외우는 게 좋다.(65=’A’ 97=’a’)
- 아스키코드는 SBCS와 MBCS의 특징을 가지고 있다.
- SBCS(Single Byte Character Set)
- 아스키코드에 해당
- 모든 문자를 1Byte로 처리
- MBCS(multi Byte Character Set)
- 문자를 사용하는데 다양한 바이트를 사용한다.(어떤 문자는 1byte, 어떤 문자는 2byte)
- 유니코드에는 해당하지 않는다.
- 반면 MBCS는 SBCS를 포함한다.
- Visual Studio는 MBCS를 사용한다.
- SBCS(Single Byte Character Set)
- C++ 자료형 중 ‘char’는 아스키코드를 담을 수 있다.
🤔 유니코드(Unicode)란?
유니코드(Unicode)는 전 세계의 모든 문자를 다루도록 설계된 표준 문자 전산 처리 방식이다
- 유니코드는 지구상에서 통용되는 대부분의 문자들을 담고 있다. 여기에는 언어를 표기할 때 쓰는 문자 이외에도 악보 기호, 이모지, 태그들도 포함된다.
- 문자 당 2byte를 사용하는 특징이 있다.
- 유니코드는 WBCS의 특징을 가지고 있다.
- WBCS(Wide Byte Character Set)
- 유니코드에 해당
- 모든 문자를 2byte로 처리.
- 유니코드에 해당
- WBCS(Wide Byte Character Set)
- C++ 자료형 중 ‘wchar_t’는 유니코드를 담을 수 있다.