用Javascript抓取网页内容

打印网页所有h2的内容

Array.from(document.querySelectorAll('h2')).map(x => console.log(x.textContent))

document.querySelectorAll返回类型为NodeListNodeList是不能用map方法的。所以需要用Array.from先把NodeList转换成array,就可以用map对每个元素操作了。

querySelectorAll的参数和CSS一样

querySelectorAll的输入选中DOM例子
h2select by tag <h2> </h2>
.cls1.cls2.cls3select by class name <h2 class=”cls1 cls2 cls3″></h2>
#id1select by id <h2 id=”id1″></h2>

除了用也可以用document.querySelectorAll也可以用document.getElementsByTagName达到一样效果。

Array.from(document.getElementsByTagName('h2')).map(x => console.log(x.textContent))

Leave a Comment

Your email address will not be published.