iconv_strlen
(PHP 5, PHP 7, PHP 8)
iconv_strlen — 文字列の文字数を返す
説明
strlen() とは違い、iconv_strlen()
は与えられたバイト列 string
中に現れる文字の数を
指定された文字セットに基づいて数えます。この結果は、必ずしも文字列の
バイト数と一致するとは限りません。
パラメータ
string
-
文字列。
encoding
-
encoding
パラメータが指定されなかった場合、もしくはnull
の場合、string
のエンコードは iconv.internal_encoding であると判断されます。
戻り値
string
の文字数を返します。
処理中にエラーが発生した場合は false
を返します。
変更履歴
バージョン | 説明 |
---|---|
8.0.0 |
encoding は、nullable になりました。
|
+add a note
User Contributed Notes 2 notes
hfuecks @ nospam org ¶
18 years ago
If iconv_strlen is passed a UTF-8 string containing badly formed sequences, it will return FALSE. This is in contrast to mb_strlen of the behaviour of utf8_decode, which strip out any bad sequences;
<?php
# UTF-8 string containing bad sequence: \xe9
$str = "I?t?rn?ti?n\xe9?liz?ti?n";
print "mb_strlen: ".mb_strlen($str,'UTF-8')."\n";
print "strlen/utf8_decode: ".strlen(utf8_decode($str))."\n";
print "iconv_strlen: ".iconv_strlen($str,'UTF-8')."\n";
?>
Displays;
mb_strlen: 20
strlen/utf8_decode: 20
iconv_strlen:
(PHP 5.0.5)
As such it is being "stricter" than mb_strlen and it may mean you need to check for invalid sequences first. A quick way to check is to exploit the behaviour of the PCRE extension (see notes on pattern modifiers);
<?php
if (preg_match('/^.{1}/us',$str,$ar) != 1) {
die("string contains invalid UTF-8");
}
?>
A slower but stricter check (regex) can be found at: http://www.w3.org/International/questions/qa-forms-utf-8
Similiar applies to iconv_substr, iconv_strpos and iconv_strrpos
sheryl ¶
4 years ago
Notice there is a disconnect:
>If charset`parameter is omitted, str is assumed to be encoded in iconv.internal_encoding.
But clicking on the iconv.internal_encoding link (https://www.php.net/manual/en/iconv.configuration.php), the docs indicate that iconv.internal_encoding is deprecated since 5.6.
↑ and ↓ to navigate •
Enter to select •
Esc to close
Press Enter without
selection to search using Google