Unicode是字符集,UTF-8是Unicode字符集的一种变长的编码方式,可以用1至4个字节表示一个字符。 举个例子,“好”字占3个字节。 <?php $utf8Array = []; $str = "好"; for ($pos = 0; $pos < strlen($str); $pos++) { $byte = substr($str, $pos, 1); $utf8Array[] = strval(decbin(ord($byte))); } print_r($utf8Array); $binCode = ''; foreach($utf8Array as $k => $v){ if($k == 0){ $binCode .= ltrim($v, '1'); $binCode = substr($binCode, 1); }else{ $binCode .= substr($v, 2); } } var_dump($binCode); $binCodeHex = base_convert($binCode, 2, 16); echo $str . ' 的UTF-8编码为 ' . $binCodeHex . PHP_EOL;