php内置了大量的字符串操作函数,比如php implode,explode等等,php截取字符串,可以用substr,mb_substr二个函数。

phpsubstr语法

substr(string, start, length)

参数

描述

string

即你要截取的字符串

start

即要截取的开始位置(0表示从从前往后数 第一个字符开始,负数表示从从后往前数)

例如:start=1,表示从从前往后开始的第二个数开始截取,start=-1,表示从从后往前开始的第一(是第一不是第二哦)个数开始截取

length

length 当为正数时,为需要截取的长度;当为负数时,即理解为去掉末尾的几个字符

例如:length=3,表示截取三个长度;length=-2,即为去掉末尾的两个字符

示例

$str1 = substr("abcdef", 1); // 返回 "bcdef"
$str2 = substr("abcdef", 2); // 返回 "cdef"
$str3 = substr("abcdef", 0,1); // 返回 "a"
$str4 = substr("abcdef", 0,2); // 返回 "ab"
$str5 = substr("abcdef", -1); // 返回 "f"
$str6 = substr("abcdef", -2); // 返回 "ef"
$str7 = substr("abcdef", 0,-1); // 返回 "abcde"
$str8 = substr("abcdef", 0,-2); // 返回 "abcd"
$str9 = substr('你好你好你好',1);//返回:��好你好你好
$str10 = mb_substr('你好你好你好',1);//返回:好你好你好

细心的童鞋可能已经发现,$str9里的substr返回的是 ��好你好你好,有中文乱码出现。

PHP中经常使用substr来进行字符串的截取,但是当我们用它来实现对中文字符进行截取的时候则会发生乱码问题

比如:

$mystring="今天天气真好";
$mysubstring=substr($mystring,0,2);
echo $mysubstring;
?>

输出结果为�;

原因分析:substr函数原型为:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字节长度,而一个中文占两个字节,对于一个UTF-8的中文字符,会把它当做3个字节来处理。

$length=strlen($mystring);echo $length;//输出结果为18
?>

也就是说我们可以用令$length为3,这样就会成功返回一个“今”字。这样的话如果中文和英文混杂的话则需要我们好好地计算一下$length了。

那这是不是有点坑爹呢,有没有更好的办法呢

请看下文

php字符串截取之mb_substr

语法

mb_substr( $str, $start, $length, $encoding )

参数

描述

$str

需要截断的字符串

$start

截断开始处

$length

长度(注意,这个跟mb_strimwidth不同,1就代表一个中文字符)

$encoding

编码,我设为 utf-8

例子

$length=mb_strlen($mystring);
$mysub=mb_substr($mystring,0,4);
echo "the length is:$length,","the substr is:$mysub";
?>

输出结果为:the length is:6,the substr is:今天天气

mb_strlen函数原型为int mb_strlen(string string_input, string encode);encode默认为UTF-8,它会将为UTF-8编码的中文字符算作一个

注意:mb_strlen与mb_substr并不是PHP的核心函数,使用前需要打开php.ini中的extension=php_mbstring.dll这一项

总结:

1、substr中文时会容易出现乱码,可以用mb_substr代替

2、mb_substr并不是PHP的核心函数,使用前需要打开php.ini中的extension=php_mbstring.dll这一项