为什么我的XPath查询(抓取HTML表)只能在Firebug中工作,而不能在我正在开发的应用程序中工作?
问题描述:
这旨在对每周出现一次或两次的所有类似问题(但过于具体的问题,不能成为接近的目标候选人)提供规范的问答。
我正在开发一个应用程序,该应用程序需要解析带有表的网站。由于派生用于抓取网页的XPath表达式很无聊且容易出错,因此我想为此使用 Firebug 的XPath提取器功能 (或其他浏览器中的类似工具)。
输入示例如下所示:
<!-- snip --> <table id="example"> <tr> <th>Example Cell</th> <th>Another one</th> </tr> <tr> <td>foobar</td> <td>42</td> </tr> </table> <!-- snip -->
我想提取第一个数据单元格(“ foobar”)。Firebug提出了XPath表达式
//table[@id="example"]/tbody/tr[2]/td[1]
可以 在任何XPath测试器插件中正常工作,但不能在我自己的应用程序中工作(未找到结果)
。如果我将查询缩减为//table[@id],它将再次起作用。
怎么了
当我们共享这样的链接时,如何在我们的网站中包含图片以显示在WhatsApp中?