php--PHP5中file_get_contents函数获取带BOM的utf-8文件内容

OStack程序员社区-中国程序员成长平台 › 门户 › 编程› PHP›PHP编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

最近，在用file_get_contents函数来取得文本的内容的时候，出现了一个情况（如下），苦思冥想了n久，不得其解，最后，果然还是得靠百度啊.....

百度到一个解释，下面是原文：

PHP5中的file_get_contents函数获取文件内容，实际是按二进制来读取的，所以，当你用file_get_contents去获取一个带BOM的UTF-8文件时，它并不会把UTF-8的BOM去掉，当你把读取的内容当作文本内容来进行一些操作时，可能会发生一些意想不到的结果。这并不能算作一个BUG，因为file_get_contents函数读取文件的时候，是按二进制来读取的，读取到的内容是包含BOM的，而用户操作的时候，想当然的以为读取到的内容是不包含BOM的文本内容（如用记事本打开后看到的内容），因为BOM在编辑软件中是不可见的，只有在十六进制模式下才可以看见，问题也就出在这，实际上是由于“操作不统一”造成的。

当对UTF-8编码的文件进行操作时，如果要把读取的内容当作文本内容来处理，最好先对BOM进行一些处理，这个问题在PHP6中得到了解决（可以设置文本/二进制读取模式)，有兴趣的朋友

可以自己查找PHP6的手册。

一个较简单的解决方法：

1 <?php
2 $dataStr = file_get_contents('test.txt');
3 if (strpos($dataStr, "\xEF\xBB\xBF") === 0) { //\x表示16进制
4     $dataStr = substr($dataStr, 3);
5 }
6 // 对$dataStr进行操作
7 ?>

或者用正则来处理：

1 <?php
2 $dataStr = file_get_contents('test.txt');
3 if (preg_match('/^\xEF\xBB\xBF/', $dataStr)) {//\x表示16进制
4 　　$dataStr = substr($dataStr, 3); 
5 } 
6 // 对$dataStr进行操作 
7 ?>

什么是BOM?

BOM是Byte Order Mark的缩写，即字节顺序标记，它是插入到UTF-8，UTF-16或UTF-32编码的Unicode文件开头的特殊标记，用来标识Unicode文件的编码类型。

几种编码对应的BOM：

EF BB BF        UTF-8
FE FF             UTF-16 (big-endian)
FF FE            UTF-16 (little-endian)
00 00 FE FF　UTF-32 (big-endian)
FF FE 00 00　UTF-32 (little-endian)

对于UTF-8编码的文件而言，BOM标记是可有可无的，Windows自带的记事本文件在保存为UTF-8编码时，会自动加上BOM，现在一些编辑软件，可以在保存为UTF-8编码时可以选择是否带

BOM保存。

对于PHP文件，在使用UTF-8编码时，最好都不要BOM保存。因为当你使用include/require/include_once/require_once这些函数去包含一个带BOM的文件时，你得到的网页，在某些兼容性

不是很好的浏览器下，你会发现你的网页的实际显示效果跟预期的有细微的差别。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Apache开启PHP的伪静态模式发布时间：2022-07-10

php添加xdebug扩展发布时间：2022-07-10

中国承认长城防火墙吗，长城防火墙的工作原

1 chasinginfinity/ml-from-scratch: Machine

chasinginfinity/ml-from-scratch: Machine Learning algorithms implemented in Pyth

阅读：1551|2022-08-19

2 mkyong/spring3-mvc-maven-annotation-hell

mkyong/spring3-mvc-maven-annotation-hello-world: Maven + Spring 3 MVC hello worl

阅读：819|2022-08-17

3 床的笔顺,关于床的笔画,体会床的部首

床的笔顺怎么写?床的笔顺笔画顺序是什么?中国练字网了解到好多人在学习中会遇到床的笔

阅读：1382|2022-11-06

4 zendesk/android-floating-action-button:

zendesk/android-floating-action-button: Floating Action Button for Android based

阅读：599|2022-08-17

5 『Delphi』File not found的解决办法

当程序启动，提示Fatal Erro：File not found:amp;#39;**.dcuamp;#39;解决办法： Tool

阅读：559|2022-07-18

6 CVE-2022-34115

Dataease v1.11.1 was discovered to contain a SQL injection vulnerability via the

阅读：1219|2022-07-29

7 万里平台桂林会场

北襟潇湘，南临沧海西枕云贵，东下番禺景致秀甲天下，美食行销全球风情别具一格，

阅读：512|2022-07-30

8 lizhuohua/linux-kernel-module-rust

lizhuohua/linux-kernel-module-rust

阅读：535|2022-08-15

9 rhysd/Shiba: Rich markdown live preview

rhysd/Shiba: Rich markdown live preview app with linter

阅读：399|2022-08-18

10 win7系统程序加锁的操作方法

win7系统电脑使用过程中有不少朋友表示遇到过win7系统程序加锁的状况，当出现win7系统

阅读：441|2022-11-06

客服电话

电子邮件

php--PHP5中file_get_contents函数获取带BOM的utf-8文件内容

请发表评论

全部评论

上一篇：

下一篇：

CVE-2022-35283

Karumi/MaxibonKataKotlin: Maxibon kata f

bradtraversy/iweather: Ionic 3 mobile we

joaomh/curso-de-matlab

断牙刷新位置时间（断牙属性及刷新位置介绍

中国承认长城防火墙吗，长城防火墙的工作原

solegalli/feature-selection-for-machine-

wangchenyan/ponyweather: Android weather

win7系统重装系统初始设置的操作方法

tietang/zebra: a dynamic gateway for gol

tradingview/charting-library-tutorial: T

关于我们

产品与服务

解决方案

139-2527-9053