存档

文章标签 ‘截取字符串’

ThinkPHP截取字符串的bug

2009年12月6日 admin 1 条评论

TP扩展函数 msubstr 截取字符串不能显示省略号的bug. 之前用设置$suffix=true了,可是还不能显示bug, 去论坛问了问,没人回答, 看了下源码。 修改了下.能正常显示省略号。
官方的源码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
/**
 +----------------------------------------------------------
 * 字符串截取,支持中文和其他编码
 +----------------------------------------------------------
 * @static
 * @access public
 +----------------------------------------------------------
 * @param string $str 需要转换的字符串
 * @param string $start 开始位置
 * @param string $length 截取长度
 * @param string $charset 编码格式
 * @param string $suffix 截断显示字符
 +----------------------------------------------------------
 * @return string
 +----------------------------------------------------------
 */
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
    if(function_exists("mb_substr"))
        return mb_substr($str, $start, $length, $charset);
    elseif(function_exists('iconv_substr')) {
        return iconv_substr($str,$start,$length,$charset);
    }
    $re['utf-8']   = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
    $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
    $re['gbk']    = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
    $re['big5']   = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";
    preg_match_all($re[$charset], $str, $match);
    $slice = join("",array_slice($match[0], $start, $length));
    if($suffix) return $slice."…";
    return $slice;
}

自己修改过的

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
    if(function_exists("mb_substr"))
	{ if($suffix) 
	  return mb_substr($str, $start, $length, $charset)."...";
      else
      return mb_substr($str, $start, $length, $charset); 
	   }
    elseif(function_exists('iconv_substr')) {
	    if($suffix) 
       return iconv_substr($str,$start,$length,$charset)."...";
       else
       return iconv_substr($str,$start,$length,$charset);
 
 
    }
    $re['utf-8']   = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
    $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
    $re['gbk']    = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
    $re['big5']   = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";
    preg_match_all($re[$charset], $str, $match);
 
}

官方的两个if 都成立就执行截取了, 没有$suffix 的事了。 汗.. *-*!
修改下,自己加上判断省略号。 OK。 ^_^

PHP 截取字符串代码

2009年12月4日 admin 没有评论

1. 截取utf8编码的多字节字符串

1
2
3
4
5
6
7
8
9
<?php  
//截取utf8字符串  
function utf8Substr($str, $from, $len)  
{  
    return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$from.'}'.  
                       '((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s',  
                       '$1',$str);  
}  
?>

2. 截取GB2312中文字符串

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<?php   
//截取中文字符串  
function mysubstr($str, $start, $len) {  
    $tmpstr = "";  
    $strlen = $start + $len;  
    for($i = 0; $i < $strlen; $i++) {  
        if(ord(substr($str, $i, 1)) > 0xa0) {  
            $tmpstr .= substr($str, $i, 2);  
            $i++;  
        } else  
            $tmpstr .= substr($str, $i, 1);  
    }  
    return $tmpstr;  
}  
?>

3. UTF-8、GB2312都支持的汉字截取函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
<?php  
/*  
Utf-8、gb2312都支持的汉字截取函数  
cut_str(字符串, 截取长度, 开始长度, 编码);  
编码默认为 utf-8  
开始长度默认为 0  
*/   
 
function cut_str($string, $sublen, $start = 0, $code = 'UTF-8')   
{   
    if($code == 'UTF-8')   
    {   
        $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";   
        preg_match_all($pa, $string, $t_string);   
 
        if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen))."...";   
        return join('', array_slice($t_string[0], $start, $sublen));   
    }   
    else   
    {   
        $start = $start*2;   
        $sublen = $sublen*2;   
        $strlen = strlen($string);   
        $tmpstr = '';   
 
        for($i=0; $i<$strlen; $i++)   
        {   
            if($i>=$start && $i<($start+$sublen))   
            {   
                if(ord(substr($string, $i, 1))>129)   
                {   
                    $tmpstr.= substr($string, $i, 2);   
                }   
                else   
                {   
                    $tmpstr.= substr($string, $i, 1);   
                }   
            }   
            if(ord(substr($string, $i, 1))>129) $i++;   
        }   
        if(strlen($tmpstr)<$strlen ) $tmpstr.= "...";   
        return $tmpstr;   
    }   
}   
 
$str = "abcd需要截取的字符串";   
echo cut_str($str, 8, 0, 'gb2312');   
?>
分类: PHP 标签: ,