欢迎来到福编程网,本站提供各种互联网专业知识!

php对gzip文件或者字符串解压实例参考

发布时间:2008-07-25 作者: 来源:转载
要采集一个网站,目标站采用了gzip压缩传输网页,本来应该只要发送一个http头Accept-Encoding:identity或者干脆不发送这个头等,就可以使目标站返回没有经过gzip压缩的页面了,不过很不幸,目标站无视客户端的请求,仍然返回gzip数据,造成乱码。
其实php对gzip解压很简单,用内置的gzdecode函数就可以了,不过很可惜我配置了半天也无法支持gzdecode函数,所以只好变通一下:
复制代码 代码如下:
if(!function_exists('gzdecode')){
functiongzdecode($data){
$flags=ord(substr($data,3,1));
$headerlen=10;
$extralen=0;
$filenamelen=0;
if($flags&4){
$extralen=unpack('v',substr($data,10,2));
$extralen=$extralen[1];
$headerlen+=2+$extralen;
}
if($flags&8)//Filename
$headerlen=strpos($data,chr(0),$headerlen)+1;
if($flags&16)//Comment
$headerlen=strpos($data,chr(0),$headerlen)+1;
if($flags&2)//CRCatendoffile
$headerlen+=2;
$unpacked=@gzinflate(substr($data,$headerlen));
if($unpacked===FALSE)
$unpacked=$data;
return$unpacked;
}
}

调用方法很简单:
复制代码 代码如下:
$f=@file_get_contents("http://www.jb51.net");
echogzdecode($f);

相关推荐