php教程

超轻量级php框架startmvc

php使用simple_html_dom解析HTML示例

更新时间:2020-03-11 01:49:14 作者:startmvc
本文实例讲述了php使用simple_html_dom解析HTML的方法。分享给大家供大家参考,具体如下:今

本文实例讲述了php使用simple_html_dom解析HTML的方法。分享给大家供大家参考,具体如下:

今天写了两个爬虫, 一个使用Python, 一个使用PHP, 说实在, 两个实现的方式都很方便.

下面说一下使用simple_html_dom这个开源类来解析HTML代码:

1. 下载simple_html_dom:

http://sourceforge.net/projects/simplehtmldom/files/

或者点击此处本站下载。

2. 用法示例:


<?php
// example of how to use basic selector to retrieve HTML contents
include('../simple_html_dom.php');
// get DOM from URL or file
$html = file_get_html('http://www.google.com/');
// find all link
foreach($html->find('a') as $e) 
 echo $e->href . '<br>';
// find all image
foreach($html->find('img') as $e)
 echo $e->src . '<br>';
// find all image with full tag
foreach($html->find('img') as $e)
 echo $e->outertext . '<br>';
// find all div tags with id=gbar
foreach($html->find('div#gbar') as $e)
 echo $e->innertext . '<br>';
// find all span tags with class=gb1
foreach($html->find('span.gb1') as $e)
 echo $e->outertext . '<br>';
// find all td tags with attribite align=center
foreach($html->find('td[align=center]') as $e)
 echo $e->innertext . '<br>';
// extract text from table
echo $html->find('td[align="center"]', 1)->plaintext.'<br><hr>';
// extract text from HTML
echo $html->plaintext;
?>

php simple_html_dom 解析HTML