컴퓨터 구조

아스키코드와 유니코드

JiHxxn 2024. 7. 20. 17:54

🤔 아스키코드(ASCII)란?

ASCII (American Standard Code for Information Interchange, 미국 정보 교환 표준 부호)

  • 아스키코드는 미국에서 정의한 표준화한 부호체계이며 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 가장 기본적인 부호 체계이다.
  • 문자 당 1byte를 사용하는 특징이 있다.
  • 아스키코드는 8비트 중 7비트 사용 나머지 1비트는 에러 검출을 위한 용도로 사용함.
  • *65번과 97번은 외우는 게 좋다.(65=’A’ 97=’a’)
  • 아스키코드는 SBCS와 MBCS의 특징을 가지고 있다.
    • SBCS(Single Byte Character Set)
      • 아스키코드에 해당
      • 모든 문자를 1Byte로 처리
    • MBCS(multi Byte Character Set)
      • 문자를 사용하는데 다양한 바이트를 사용한다.(어떤 문자는 1byte, 어떤 문자는 2byte)
      • 유니코드에는 해당하지 않는다.
      • 반면 MBCS는 SBCS를 포함한다.
      • Visual Studio는 MBCS를 사용한다.
  • C++ 자료형 중 ‘char’는 아스키코드를 담을 수 있다.

🤔 유니코드(Unicode)란?

유니코드(Unicode)는 전 세계의 모든 문자를 다루도록 설계된 표준 문자 전산 처리 방식이다

  • 유니코드는 지구상에서 통용되는 대부분의 문자들을 담고 있다. 여기에는 언어를 표기할 때 쓰는 문자 이외에도 악보 기호, 이모지, 태그들도 포함된다.
  • 문자 당 2byte를 사용하는 특징이 있다.
  • 유니코드는 WBCS의 특징을 가지고 있다.
    • WBCS(Wide Byte Character Set)
      • 유니코드에 해당
        • 모든 문자를 2byte로 처리.
  • C++ 자료형 중 ‘wchar_t’는 유니코드를 담을 수 있다.

'컴퓨터 구조' 카테고리의 다른 글

가상 메모리  (0) 2024.07.22
10진수와 2진수 변환 계산하기  (0) 2024.07.17
메모리 계층 구조  (0) 2024.07.16
CPU 구조  (1) 2024.07.15
비트 계산식 (2의 보수법)  (0) 2024.06.10