Tag Archives: utf-8

[MySQL/MariaDB] utf8mb4 언어셋 소개 및 표현범위.

HYEONG HWAN, MUN/ 3월 2, 2015/ 미분류/ 20 comments

기술이 매우 빠르게 발전한다. 배워도 배워도 계속 배워야 한다.   최근에 라엘이가 앞으로 100년동안은 나타나지 않을 것이라고 예상했던, 4 Byte UTF-8 문자열을 보고 여러 깨닳은 바가 있었고 여러분에게 도움이 될만한 정보가 있어 공유하려고 한다.   데이터베이스를 구축하다보면 텍스트 데이터(Text Data)를 취급해야 할 때가 있다. 이때 반드시 고민해야 하는 것이 있는데, 바로 문자셋(character set)을 선택하는 것이다.   핵심 단어의 뜻 먼저 중요한 두 단어 Charset 과 Collation 의 뜻에 대해서 알고 가자. 구글 번역기를 이용하여 단어 자체의 뜻을 알아보자.     charset 은 문자 집합, collation 은 정렬을 뜻한다.   자료형이 왜 필요하나? 먼저 자료형이 왜 필요할지부터 생각해보자.   컴퓨터 프로그램은 프로그래머가 의도한 대로 동작한다. 이 때 같은 목적의 프로그램이라고 할지라도 효율적으로 동작하는 것이 더 좋은 프로그램이 된다. “컴퓨터 알고리즘(Computer Algorithm)” 학문에서는 이를…

[PHP] UTF-8 한글 및 다국어 글자수 자르기

HYEONG HWAN, MUN/ 10월 18, 2014/ 미분류/ 5 comments

배경 인터넷이 전세계적으로 보급되면서 전세계 모든 언어를 다룰 수 있는 “다국어”라는 언어셋을 이용하게 되었다. 같은 내용을 저장했을 때 “다국어 언어셋”으로 작성된 문서는 “한국어 언어셋”으로 작성된 문서보다 용량이 크다. 요즘에는 필수적으로 웹사이트에서 다국어 언어셋(UTF-8 charset)을 사용합니다.   현재 가장 올바른 글자수 자르는 방법. 결과 : 7안녕? 반