티스토리 뷰

728x90

문자 인코딩

문자 집합을 컴퓨터가 이해하는 0과 1로 이루어진 문자 코드로 변환하는 과정

아스키코드 ASCII

  • 초창기 컴퓨터에서 사용하던 문자 집합 중 하나
  • 알파벳, 아라비아숫자, 일부 특수문자 포함
  • 한글 표기할 수 없음

 

EUC-KR

  • KS X 1001, KS X 1003 문자 집합 기반의 인코딩 방식
  • 아스키 문자는 1바이트, 한글 글자는 2바이트 크기의 코드 부여
  • 네자리 16진수로 표현
  • 2,350개의 한글 표현 가능 → 모든 한글 조합을 표현할 순 없음

 

16진수 유니코드

  • EUC-KR에 비해 훨씬 많은 언어, 특수문자, 화살표, 이모티콘까지 코드로 표현 가능한 통일된 문자 집합
  • 대부분의 언어를 지원하여 현대 가장 많이 사용되는 표준 문자 집합
  • EUC-KR과는 다르게 글자에 부여된 값 자체를 인코딩된 값으로 삼지 않고 UTF-8, UTF-16, UTF-32 등의 방식으로 인코딩
    • 가변 길이 인코딩: UTF-8, UTF-16
    • 고정 길이 인코딩: UTF-32

 

 

base64인코딩

  • 문자 뿐 아니라 이진 데이터까지 변환할 수 있는 인코딩 방식
  • 이미지 등 단순 문자 이외의 데이터까지 모두 아스키 문자 형태로 표현 가능
  • 64진법. 64개의 문자가 사용됨.
  • 바이너리 데이터를 base64로 6비트씩 나누어 인코딩
  • 패딩: 6비트로 나누어 떨어지지 않는 곳은 0으로 채우우는 것. ‘=’로 인코딩 됨

 


참고: 이것이 취업을 위한 컴퓨터 과학이다 with CS 기술 면접 (https://product.kyobobook.co.kr/detail/S000214014967)

728x90
댓글
300x250
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/01   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함