JavaScript和PHP:去除页面中的CSS和JS,只保留DOM结构

在网页开发中,有时我们需要从抓取的页面中提取出DOM结构,而去掉其中的CSS和JS代码。这样可以使提取的DOM结构更加清晰简洁,减少不必要的噪音。本文将介绍如何使用JavaScript和PHP来实现这一目标。

JavaScript实现:

在JavaScript中,我们可以使用DOM API来操作页面的DOM结构。以下是一个简单的JavaScript函数,它可以帮助我们去除页面中的CSS和JS代码,只保留DOM结构:

function removeCSSAndJS() {
   
  // 移除所有的CSS链接
  var links = document.querySelectorAll('link[rel="stylesheet"]');