[PHP] UTF-8 한글 및 다국어 글자수 자르기

HYEONG HWAN, MUN/ 10월 18, 2014/ 미분류/ 5 comments

https://blog.lael.be/post/77

배경

인터넷이 전세계적으로 보급되면서 전세계 모든 언어를 다룰 수 있는 “다국어”라는 언어셋을 이용하게 되었다.
같은 내용을 저장했을 때 “다국어 언어셋”으로 작성된 문서는 “한국어 언어셋”으로 작성된 문서보다 용량이 크다.
요즘에는 필수적으로 웹사이트에서 다국어 언어셋(UTF-8 charset)을 사용합니다.

 

현재 가장 올바른 글자수 자르는 방법.


$mystr = '안녕? 반가워'; // example

echo mb_strlen($mystr, 'UTF-8'); // 7

echo mb_substr($mystr, 0, 5, 'UTF-8'); // 안녕? 반

결과 :

7안녕? 반

 

5 Comments

Leave a Comment

작성하신 댓글은 관리자의 수동 승인 후 게시됩니다.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>
*
*