perl如何提取网页内容,匹配字符串

2025-04-14 13:38:16
推荐回答(2个)
回答1:

功能实现:

  1. 抓取网页使用了LWP::Simple

  2. 字符串编码使用了Encode模块的encode方法,若不进行转码则会乱码

具体代码:代码先从网页下载网页文件,然后写入文件中

use LWP::Simple;
use utf8;
use Encode;

open F,'>d:/bc.html';

 
$content = get("http://www.baidu.com");
#Encode::_utf8_on($content);
$content=encode('gb2312',$content);

die "Couldn't get it!" unless defined $content;
print F $content;

#print 'complete';
close F;

回答2:

使用正则表达式