加入收藏 | 设为首页 | 会员中心 | 我要投稿 开发网_商丘站长网 (https://www.0370zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

PHP如何采集指定的内容

发布时间:2022-09-30 11:30:20 所属栏目:PHP教程 来源:
导读:  利用PHP程序如何采集指定区域的内容,我们今天以一个简单的案例来说明。

  本案例是采集新浪sina网首页的新闻,利用php程序去抓取相关标题。下图是抓取的效果图:

  采集效果图

  我实现采集的
  利用PHP程序如何采集指定区域的内容,我们今天以一个简单的案例来说明。
 
  本案例是采集新浪sina网首页的新闻,利用php程序去抓取相关标题。下图是抓取的效果图:
 
  采集效果图
 
  我实现采集的过程是这样的:
 
  需要用到php的file_get_contents,preg_match等函数。
 
  $file=file_get_contents('http://www.sina.com.cn/');
  preg_match('/([\s\S]*)<\/head>/',$file,$head);
  print_r($head[0]);
  echo '
 
  ';
  preg_match('/
  ([\s\S]*)
  <\/span>/',$file,$body);
  print_r($body[1]);
  echo '';
  echo '
  ';
  看到没有,就是简单的几步,就实现了PHP采集效果。如果对样式有不满意的地方php采集类,可以再自行修改。
 
  总结:
 
  1.我们使用preg_match正则匹配要抓取模块的div,然后再输出就行了。
 
  2.这个例子比较简单,当遇到稍微复杂一点的需求的时候,告诉大家一个调式的好办法。
 
  比如说上面的例子当中你想要看看head部分究竟输出的是什么,可以使用htmlspecialchars函数,来防止转义:htmlspecialchars($head[0]), 这样输出的就是正则匹配的head部分的代码,方便你的查看和调式。
 

(编辑:开发网_商丘站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!