idn_to_utf8
(PHP 5 >= 5.3.0, PHP 7, PHP 8, PECL intl >= 1.0.2, PECL idn >= 0.1)
idn_to_utf8 — IDNAのASCII方式でエンコードされたドメイン名をUnicodeに変換する
説明
手続き型
string
$domain
,int
$flags
= IDNA_DEFAULT
,int
$variant
= INTL_IDNA_VARIANT_UTS46
,array
&$idna_info
= null
): string|false
IDNAのASCII方式でエンコードされたドメイン名をUTF-8でエンコードされたUnicodeに変換します。
パラメータ
domain
-
IDNAのASCII方式でエンコードされた、変換対象のドメイン名
flags
-
変換オプション - IDNA_ ではじまる定数 (IDNA_ERROR_* 定数を除く) の組み合わせです
variant
-
IDNA 2003 の場合は
INTL_IDNA_VARIANT_2003
(PHP 7.2.0 以降は非推奨)、あるいは UTS #46 の場合はINTL_IDNA_VARIANT_UTS46
(ICU 4.6 以降のみ利用可能)。 idna_info
-
このパラメータを使うのは、
variant
がINTL_IDNA_VARIANT_UTS46
の場合だけです。 このとき、このパラメータには'result'
、'isTransitionalDifferent'
、そして'errors'
の三つのキーを含む配列が入ります。'result'
にはおそらく不正だと考えられる変換結果、'isTransitionalDifferent'
には UTS #46 の非移行的な機能を使って結果を変更したかどうかをあらわす boolean 値、そして'errors'
はエラー定数 IDNA_ERROR_* のビットセットを表します。
戻り値
Unicodeのドメイン名。UTF-8 にエンコードされています。失敗した場合に false
を返します
変更履歴
バージョン | 説明 |
---|---|
7.4.0 |
variant のデフォルト値が
INTL_IDNA_VARIANT_UTS46 となり、
その代わりに INTL_IDNA_VARIANT_2003 は非推奨となりました。
|
7.2.0 |
INTL_IDNA_VARIANT_2003 は非推奨です。代わりに
INTL_IDNA_VARIANT_UTS46 を使用してください。
|
例
例1 idn_to_utf8() の例
<?php
echo idn_to_utf8('xn--tst-qla.de');
?>
上の例の出力は以下となります。
tast.de
User Contributed Notes 1 note
<?php
// for those who has PHP older than version 5.3
class IDN {
// adapt bias for punycode algorithm
private static function punyAdapt(
$delta,
$numpoints,
$firsttime
) {
$delta = $firsttime ? $delta / 700 : $delta / 2;
$delta += $delta / $numpoints;
for ($k = 0; $delta > 455; $k += 36)
$delta = intval($delta / 35);
return $k + (36 * $delta) / ($delta + 38);
}
// translate character to punycode number
private static function decodeDigit($cp) {
$cp = strtolower($cp);
if ($cp >= 'a' && $cp <= 'z')
return ord($cp) - ord('a');
elseif ($cp >= '0' && $cp <= '9')
return ord($cp) - ord('0')+26;
}
// make utf8 string from unicode codepoint number
private static function utf8($cp) {
if ($cp < 128) return chr($cp);
if ($cp < 2048)
return chr(192+($cp >> 6)).chr(128+($cp & 63));
if ($cp < 65536) return
chr(224+($cp >> 12)).
chr(128+(($cp >> 6) & 63)).
chr(128+($cp & 63));
if ($cp < 2097152) return
chr(240+($cp >> 18)).
chr(128+(($cp >> 12) & 63)).
chr(128+(($cp >> 6) & 63)).
chr(128+($cp & 63));
// it should never get here
}
// main decoding function
private static function decodePart($input) {
if (substr($input,0,4) != "xn--") // prefix check...
return $input;
$input = substr($input,4); // discard prefix
$a = explode("-",$input);
if (count($a) > 1) {
$input = str_split(array_pop($a));
$output = str_split(implode("-",$a));
} else {
$output = array();
$input = str_split($input);
}
$n = 128; $i = 0; $bias = 72; // init punycode vars
while (!empty($input)) {
$oldi = $i;
$w = 1;
for ($k = 36;;$k += 36) {
$digit = IDN::decodeDigit(array_shift($input));
$i += $digit * $w;
if ($k <= $bias) $t = 1;
elseif ($k >= $bias + 26) $t = 26;
else $t = $k - $bias;
if ($digit < $t) break;
$w *= intval(36 - $t);
}
$bias = IDN::punyAdapt(
$i-$oldi,
count($output)+1,
$oldi == 0
);
$n += intval($i / (count($output) + 1));
$i %= count($output) + 1;
array_splice($output,$i,0,array(IDN::utf8($n)));
$i++;
}
return implode("",$output);
}
public static function decodeIDN($name) {
// split it, parse it and put it back together
return
implode(
".",
array_map("IDN::decodePart",explode(".",$name))
);
}
}
echo IDN::decodeIDN($_SERVER['HTTP_HOST']);
?>