php判断网页是否gzip压缩

OStack程序员社区-中国程序员成长平台 › 门户 › 编程› PHP›PHP编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

昨天晚上群里有朋友采集网页时发现file_get_contents 获得的网页保存到本地为乱码,响应的header 里 Content-Encoding:gzip

但在浏览器里看是正常的。

因为我有过相关经验马上发现是网站开启了gzip而file_get_contents 获得的是压缩过的页面，而不是解压过的页面(去年有一篇相关文章里面有解决方法：php file_get_contents读取远程文件的乱码问题(gzip压缩引起的) ) 问题得到解决;（不知道是不是要file_get_conttents 请求网页时带上相应的参数，直接获得没有被gzip压缩过的网页？）。

刚好我前不久刚看到可以用读取文件的前2个字节判断文件类型。群里面的朋友也说gzip压缩过的网页(gbk编码)前2字节是 1F 8B 于是就可以判断网页是否gzip压缩过。
代码如下：

 //米尔军事网采用 gzip压缩网页
 //file_get_contents 直接获得的网页是乱码。
 header('Content-Type:text/html;charset=utf-8' );
 $url = 'http://www.miercn.com';
 $file = fopen($url, "rb");  
 //只读2字节  如果为(16进制)1f 8b (10进制)31 139则开启了gzip ;
 $bin = fread($file, 2); 
 fclose($file);  
 $strInfo = @unpack("C2chars", $bin);  
 $typeCode = intval($strInfo['chars1'].$strInfo['chars2']);  
 $isGzip = 0;  
 switch ($typeCode)  
 {
     case 31139:      
       //网站开启了gzip
         $isGzip = 1;
         break;
     default:  
         $isGzip = 0;
 }  
 $url = $isGzip ? "compress.zlib://".$url:$url; // 三元表达式
 $mierHtml = file_get_contents($url); //获得米尔军事网数据
 $mierHtml = iconv("gbk","utf-8",$mierHtml);
 echo $mierHtml;

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

php折线图布局图发布时间：2022-07-10

PHP解压网页GZIP发布时间：2022-07-10

solegalli/feature-selection-for-machine-

tianli/matlab_offscreen: Matlab offscree

2022-08-17

win7系统重装系统初始设置的操作方法

2022-11-06

これがマストドンだ！使い方からインスタ

2022-08-17

黄聪：Delphi中使用ReportMachine 6.5中汇

2022-07-18

matlab练习程序（线性常微分方程组参数拟合

2022-07-18

阅读排行榜

1 MATLAB信号与系统分析（四）——离散信号与

一、系统的z变换和反变换 1、利用部分分式展开求解逆Z变换： 2、例子 3、Z变换的MATLA

阅读：540|2022-07-18

2 krishnaik06/Machine-Learning-in-90-days

krishnaik06/Machine-Learning-in-90-days

阅读：1121|2022-08-18

3 CVE-2022-2316

HTML injection vulnerability in secure messages of Devolutions Server before 202

阅读：1338|2022-07-08

4 armancodv/building-energy-model-matlab:

armancodv/building-energy-model-matlab: It is a small software which is develope

阅读：1167|2022-08-17

5 FGRibreau/import-tweets-to-mastodon: How

FGRibreau/import-tweets-to-mastodon: How to import tweets to mastodon (e.g. http

阅读：974|2022-08-17

6 tboronczyk/localization-middleware: PSR-

tboronczyk/localization-middleware: PSR-15 middleware to assist primarily with l

阅读：521|2022-08-16

7 臣的笔顺,解析臣的笔画,剖析臣的部首

臣的笔顺怎么写?臣的笔顺笔画顺序是什么?解析臣字的笔画顺序怎么写了解到好多的写字朋

阅读：565|2022-07-30

8 dotnet/MobileBlazorBindings: Experimenta

dotnet/MobileBlazorBindings: Experimental Mobile Blazor Bindings - Build native

阅读：438|2022-08-29

9 池的笔顺,谈谈池的笔画,讲述池的部首

池的笔顺怎么写?池的笔顺笔画顺序是什么?中国练字网了解到好多人在学习中会遇到池的笔

阅读：942|2022-11-06

10 heinrichreimer/material-intro: A simple

heinrichreimer/material-intro: A simple material design app intro with cool anim

阅读：427|2022-08-17

客服电话

电子邮件

php判断网页是否gzip压缩

请发表评论

全部评论

上一篇：

下一篇：

Ubuntu 16.04安装Matlab 2016b教程

PacktPublishing/Python-Machine-Learning-

sussillo/hfopt-matlab: A parallel, cpu-b

鲁东大学一米网:Win7系统USB驱动器RAM的操

emersion/go-ostatus: An OStatus library

solegalli/feature-selection-for-machine-

tianli/matlab_offscreen: Matlab offscree

win7系统重装系统初始设置的操作方法

これがマストドンだ！使い方からインスタ

黄聪：Delphi中使用ReportMachine 6.5中汇

matlab练习程序（线性常微分方程组参数拟合

关于我们

产品与服务

解决方案

139-2527-9053

客服电话

电子邮件

php判断网页是否gzip压缩

请发表评论

全部评论

上一篇：

下一篇：

Ubuntu 16.04安装Matlab 2016b教程

PacktPublishing/Python-Machine-Learning-

sussillo/hfopt-matlab: A parallel, cpu-b

鲁东大学一米网:Win7系统USB驱动器RAM的操

emersion/go-ostatus: An OStatus library

solegalli/feature-selection-for-machine-

tianli/matlab_offscreen: Matlab offscree

win7系统重装系统初始设置的操作方法

これがマストドンだ！ 使い方からインスタ

黄聪：Delphi中使用ReportMachine 6.5中汇

matlab练习程序（线性常微分方程组参数拟合

关于我们

产品与服务

解决方案

139-2527-9053

これがマストドンだ！使い方からインスタ