Web页面即HTML文件主要由三部分构成:序、头部和主体。序在页面的第一行,头部用来定义整个文档,主体是文档的主要部分。
HTML是标记语言,所以用户可以使用任何编辑文本的编辑器来进行页面文件的编写,如Word 2010,但一定用纯文本格式保存。因为浏览器只识别纯文本格式的文件。
一段HTML由元素和标签构成。元素是要处理的对象,这些元素一般要在浏览器中显示出来。在页面文件中,一个元素可以包含另外的元素,形成网状结构。元素具有不同的属性,例如图像就有大小,对齐方式、边框、超级链接等属性。元素都有相应的标志来进行区分,而文本是HTML文件中最基本的元素,不需要用标志。
标签本身由标签名和属性构成,放在尖括号中。标签总是成对出现的,结束标签是在标签名前加了一个斜杠,两个标签之间就是元素的内容。有一些标签只有起始标志,没有结束标志。
解决php字符串长度不等的方法:首先通过“mb_detect_encoding()”函数查看两个字符串的编码方式;然后查看具体字符长度;最后剔除非中文字符即可。问题:
如图所示 咋眼看去两个一样的中文字符串“后勤保障部”,但一个长度为21 一个为15。
首先直觉可能会认为是编码方式不一样导致的,
通过mb_detect_encoding()函数查看两个字符串的编码方式 代码如下
1
2
3
4
<?phpheader("Content-Type: text/htmlcharset=utf-8")
$data[0]=$str1="后勤保障部"$data[1]=$str2="后勤保障部"
var_dump($data)//查看编码方式$encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5"))$encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5"))echo "str1='".$str1."'"." 编码:".$encode1."</br>"echo "str2='".$str2."'"." 编码:".$encode2."</br>"?>
但输出结果都是UTF-8
那么是什么原因呢 ,我们在输出看下具体字符长度
1
2
3
4
<?phpheader("Content-Type: text/htmlcharset=utf-8")
$data[0]=$str1="后勤保障部"$data[1]=$str2="后勤保障部"
var_dump($data)//查看编码方式$encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5"))$encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5"))//当mb_strlen的内码选择为UTF-8的时候,则会将中文字符当成一个字符//strlen,得到的是字符串所占的字节数echo "str1='".$str1."'".": 字符长度:".mb_strlen($str1).": 字节长度:".strlen($str1)." 编码:".$encode1."</br>"echo "str2='".$str2."'".": 字符长度:".mb_strlen($str2).": 字节长度:".strlen($str2)." 编码:".$encode2."</br>"?>
输出结果如下:
发现字符串str1有7个中文字符,但实际只显示了5个,也就是“后勤保障部”
通过截取str1最后两个字符查看
1
//截取str1后面两个未显示字符$res=mb_substr($str1, 5,2)echo "最后两字符:".$res."</br>"echo mb_strlen($res)
无法echo显示,但确实占有两个字符
如果实际要求这看上去一样的字符串就相等的话,需要进行处理,处理就是剔除非中文字符:
//剔除str1字串中未显示的字符(非中文字符)preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str1, $matches)$str1 = join('', $matches[0])
最终代码如下
1
2
3
4
5
6
7
8
9
10
11
12
<?phpheader("Content-Type: text/htmlcharset=utf-8")
$data[0]=$str1="后勤保障部"$data[1]=$str2="后勤保障部"
var_dump($data)//查看编码方式$encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5"))$encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5"))//当mb_strlen的内码选择为UTF-8的时候,则会将中文字符当成一个字符//strlen,得到的是字符串所占的字节数echo "str1='".$str1."'".": 字符长度:".mb_strlen($str1).": 字节长度:".strlen($str1)." 编码:".$encode1."</br>"echo "str2='".$str2."'".": 字符长度:".mb_strlen($str2).": 字节长度:".strlen($str2)." 编码:".$encode2."</br>"//截取str1后面两个未显示字符echo "</br>------------------截取str1后面两个未显示字符---------------------</br>"$res=mb_substr($str1, 5,2)echo "str1最后两字符: ".$res."</br>"echo "str1长度: ".mb_strlen($res)."</br>"//比较echo "</br>--------------------------相等比较----------------------------------</br>"echo "str1 与 str2比较: "echo strcomp($str1,$str2)."</br>"echo "str2 与 str2比较: "echo strcomp($str2,$str2)."</br>"//剔除str1字串中非中文preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str1, $matches)$str1 = join('', $matches[0])echo "</br>---------------------剔除str1字串中非中文后----------------------</br>"echo "str1='".$str1."'".": 字符长度:".mb_strlen($str1).": 字节长度:".strlen($str1)." 编码:".$encode1."</br>"echo "str1 与 str2比较: "echo strcomp($str1,$str2)."</br>"function strcomp($str1,$str2){
if($str1 == $str2){
return "相等"
}else{
return "不等"
}
}
?>
运行结果
注:
将21字节的str1复制到phpmyadmin的sql输入框,显示如下
嗯 就是多的那两个字符
更多相关知识,请访问PHP中文网!
以上就是解决php字符串一样但长度不等的问题的详细内容,更多请关注php中文网其它相关文章!
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
专题推荐:php
上一篇:评价一台计算机的性能主要通过哪几个方面下一篇:自己动手写 PHP MVC 框架(40节精讲/巨细/新人进阶必看)
欢迎分享,转载请注明来源:优选云