본문 바로가기
반응형

인코딩3

초보 자바 프로그래밍(43) - 주요 MBCS 인코딩 방식 🔖 INDEX   ISO-8859-1 (ISO Latin-1)ISO-8859-1(Latin-1)은 서유럽 언어에 사용되는 문자들을 포함한 8비트 인코딩 방식입니다. 이 인코딩 방식은 256개의 문자를 표현할 수 있으며, 그 중 128개는 ASCII 문자와 동일합니다. 나머지 128개의 문자는 서유럽 언어(예: 프랑스어, 독일어, 스페인어 등)에서 사용되는 특수 문자, 악센트가 붙은 문자, 기호 등을 포함합니다. ISO-8859-1 인코딩의 특징8비트 인코딩으로 문자당 1바이트로 표현할 수 있습니다.영어와 서유럽 언어를 효율적으로 표현할 수 있지만, 다른 언어의 문자를 표현하기에는 부족합니다.ASCII 문자와 호환되어 처리 속도가 빠릅니다. ISO-8859-1 사용 예제간단한 자바 예제 코드를 통해 IS.. 2023. 5. 4.
초보 자바 프로그래밍(42) - 주요 유니코드 인코딩 방식 🔖 INDEX   UTF-8 인코딩UTF-8(Unicode Transformation Format 8-bit)은 유니코드 문자를 가변 길이의 바이트로 인코딩하는 방식으로, 각 문자에 따라 바이트 길이가 다릅니다. 유니코드는 전 세계 언어의 문자를 포함하고 있어, 그 수가 상당히 많습니다. 따라서 UTF-8 인코딩은 문자의 종류에 따라 필요한 바이트 길이를 최적화하여 저장 공간을 절약하고, 처리 속도를 높이기 위해 고안되었습니다. UTF-8 인코딩 원리ASCII 문자: 1바이트로 인코딩되며, ASCII 문자 그대로 사용됩니다. 즉, 0xxxxxxx 형태의 7비트로 표현됩니다.다른 문자: 2바이트 이상으로 인코딩되며, 인코딩된 바이트의 수를 앞의 연속된 1비트 개수로 표현합니다. 예를 들어, 인코딩된 바이.. 2023. 5. 4.
초보 자바 프로그래밍(41) - 문자셋과 유니코드 🔖 INDEX   문자셋(Character Set)과 유니코드(Unicode)는 모두 컴퓨터에서 문자를 표현하고 처리하기 위한 체계입니다. 그리고, 자바에서 문자 데이터를 다루는 데 있어서 인코딩(Encoding)은 매우 중요한 개념입니다. 이 글에서는 문자셋과 유니코드, 인코딩을 이해하고 활용하는 방법에 대해서 알아보겠습니다. 문자셋과 인코딩문자셋은 컴퓨터가 문자를 표현하고 인식하는 규칙의 집합입니다. 문자셋을 이해하기 위해서는 다음과 같은 개념들을 알아야 합니다.코드 포인트 (Code Point)코드 포인트(Code Point)는 문자를 컴퓨터에서 표현하는 데 사용되는 고유한 숫자 값입니다. 문자셋에서 문자에 할당된 고유한 숫자로, 이 숫자를 통해 컴퓨터가 해당 문자를 인식하고 처리할 수 있습니다... 2023. 5. 4.
반응형