반응형 유니코드2 초보 자바 프로그래밍(42) - 주요 유니코드 인코딩 방식 🔖 INDEX UTF-8 인코딩UTF-8(Unicode Transformation Format 8-bit)은 유니코드 문자를 가변 길이의 바이트로 인코딩하는 방식으로, 각 문자에 따라 바이트 길이가 다릅니다. 유니코드는 전 세계 언어의 문자를 포함하고 있어, 그 수가 상당히 많습니다. 따라서 UTF-8 인코딩은 문자의 종류에 따라 필요한 바이트 길이를 최적화하여 저장 공간을 절약하고, 처리 속도를 높이기 위해 고안되었습니다. UTF-8 인코딩 원리ASCII 문자: 1바이트로 인코딩되며, ASCII 문자 그대로 사용됩니다. 즉, 0xxxxxxx 형태의 7비트로 표현됩니다.다른 문자: 2바이트 이상으로 인코딩되며, 인코딩된 바이트의 수를 앞의 연속된 1비트 개수로 표현합니다. 예를 들어, 인코딩된 바이.. 2023. 5. 4. 초보 자바 프로그래밍(41) - 문자셋과 유니코드 🔖 INDEX 문자셋(Character Set)과 유니코드(Unicode)는 모두 컴퓨터에서 문자를 표현하고 처리하기 위한 체계입니다. 그리고, 자바에서 문자 데이터를 다루는 데 있어서 인코딩(Encoding)은 매우 중요한 개념입니다. 이 글에서는 문자셋과 유니코드, 인코딩을 이해하고 활용하는 방법에 대해서 알아보겠습니다. 문자셋과 인코딩문자셋은 컴퓨터가 문자를 표현하고 인식하는 규칙의 집합입니다. 문자셋을 이해하기 위해서는 다음과 같은 개념들을 알아야 합니다.코드 포인트 (Code Point)코드 포인트(Code Point)는 문자를 컴퓨터에서 표현하는 데 사용되는 고유한 숫자 값입니다. 문자셋에서 문자에 할당된 고유한 숫자로, 이 숫자를 통해 컴퓨터가 해당 문자를 인식하고 처리할 수 있습니다... 2023. 5. 4. 이전 1 다음 반응형