본문 바로가기

캐릭터셋3

Locale의 LANG 과 Putty의 캐릭터셋 설정에 따른 한글 깨짐 현상 흔히 사용하는 한글 캐릭터셋의 두종류 UTF-8,EUCKR(CP949,MSWIN949)가 있습니다. 볼려고 하는 프로그램과 파일의 캐릭터셋이 다를 때 한글이 깨지는 현상이 나타나기도 하는데요, 이것을 4가지 경우로 나눠 한글이 어떤 경우에 깨지는지 테스트 해보겠습니다. 사전준비사항 메모장에서 아래의 내용을 한글로 입력하고 인코딩방식을 UTF-8과 ANSI 두가지로 저장합니다. 각각 UTF8.csv ANSI.csv로 만들고 Linux 서버에 업로드합니다. 내용 1,홍길동 2,배익순 3,김구라 4,유재석 5,박명수 클라이언트 프로그램은 putty를 이용하였습니다. EUCKR 설정법은 기본적인 인코딩에는 없어서 아래 블로그를 참고하여 EUCKR로 설정하였습니다. 참고 URL https://limetimelin.. 2021. 10. 15.
Character Set 한글 테스트 목적 : UTF8과 K016MSWIN949에서 각각 한글데이터를 넣었을때 잘 들어가는지, 잘 보이는지에 대한 테스트입니다. 사용 환경: [oracle@ysbae ~]$ cat /etc/redhat-release Red Hat Enterprise Linux Server release 7.5 (Maipo) SYS@newysbae> select instance_name,version from v$instance; INSTANCE_NAME VERSION ---------------- ----------------- newysbae 11.2.0.1.0 1 row selected. 요약 : 서버의 캐릭터셋과 클라이언트의 캐릭터셋을 맞춰주는 것이 제일 중요합니다. 다를 시 데이터가 깨질 수 있습니다. 테스트 진행 서.. 2020. 4. 20.
Character Set DB의 캐릭터셋(Character Set)이란 중요한 요소입니다. DB에 데이터를 저장할때 어떤 형식으로 저장할것인지 결정하는 요소이기 때문이고, 여러가지 종류가 있지만 종류에 따라서 글자수 당 byte가 다른 경우도 있으므로 데이터의 성격에 따라 신중하게 설정해야 한다고 개인적으로 생각합니다. 1.한글을 지원하는 캐릭터셋의 종류와 간단한 설명 아래는 대표적인 캐릭터셋의 종류와 간단한 설명입니다. KO16MSWIN949 (CP949) 마이크로 소프트에서 만든 케릭터셋으로 한글을 표현할 수 있는 대표적인 캐릭터셋입니다. 이 캐릭터셋은 기본적으로 있던 KSC5601의 조합에 추가로 모든 한글을 표현할 수 있다고 합니다. KSC5601에서 지원하는 글자는 가나다순이지만, 그 외 글자는 뒤죽박죽으로 정의되어 있.. 2020. 4. 20.