功能实现:
抓取网页使用了LWP::Simple
字符串编码使用了Encode模块的encode方法,若不进行转码则会乱码
具体代码:代码先从网页下载网页文件,然后写入文件中
use LWP::Simple;
use utf8;
use Encode;
open F,'>d:/bc.html';
$content = get("http://www.baidu.com");
#Encode::_utf8_on($content);
$content=encode('gb2312',$content);
die "Couldn't get it!" unless defined $content;
print F $content;
#print 'complete';
close F;
使用正则表达式