博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
3.15. XML
阅读量:6677 次
发布时间:2019-06-25

本文共 1153 字,大约阅读时间需要 3 分钟。

3.15.1. DOM

3.15.1.1. loadHTML

$html =  curl($url);libxml_use_internal_errors(true);$dom = new DOMDocument();$dom->loadHTML($html);

3.15.1.2. XPath

3.15.1.2.1. evaluate
loadHTMLFile('http://netkiller.github.io/'); $xpath = new DOMXPath($doc);$title = $xpath->evaluate('string(/html/head/title)'); echo "Document title is: " . $title . "\n";?>
3.15.1.2.2. query
referer = $url; return $response; }$url = "http://netkiller.github.io/journal/index.html";$html = curl($url);libxml_use_internal_errors(true);$dom = new DOMDocument();$dom->loadHTML($html);$xpath = new DOMXPath($dom);$xml = $xpath->query('//div[@class="section"]');foreach ($xml as $result_object){ //echo $result_object->childNodes->item(0)->nodeValue; print_r($result_object);}

3.15.1.3. saveHTML

下面的例子是从某个网站扣取一个HTML块的例子

$url = "http://netkiller.github.io/journal/index.html";$html =  curl($url);libxml_use_internal_errors(true);$dom = new DOMDocument();$dom->loadHTML($html);$xpath = new DOMXPath($dom);$xml = $xpath->query('//div[@class="section"]');$xhtml = $dom->saveHTML($xml->item(0));print_r($xhtml);

原文出处:Netkiller 系列 手札

本文作者:陈景峯
转载请与作者联系,同时请务必标明文章原始出处和作者信息及本声明。

你可能感兴趣的文章
Sublime Text 3 安装插件管理 Package Control
查看>>
移动web图片加载完获取img宽高
查看>>
线段树入门
查看>>
AngularJs的UI组件ui-Bootstrap分享(七)——Buttons和Dropdown
查看>>
牛客小白月赛14 -G (筛法)
查看>>
Java内存模型(JMM)
查看>>
守护进程
查看>>
mongodb之 oplog 日志详解
查看>>
Project Euler Problem 32 Pandigital products
查看>>
HDU1205 吃糖果【水题】
查看>>
扩展欧几里得算法与模乘逆元的程序
查看>>
《转》对数组的一些理解
查看>>
js 原型链解密
查看>>
React-Native-Android-Studio整合开发+环境配置+官方实例
查看>>
System.out.println()的含义
查看>>
模仿jquery框架源码---网络
查看>>
php异常处理类
查看>>
UNIX常见命令索引 (echo,find,xargs)
查看>>
第二周(4.23~4.29)
查看>>
spring(5)注解
查看>>