網站去噪流程
日期 : 2022-08-14 22:06:11
網站去噪流程:1) 節點分割。將網頁映射為DOM樹, 根據當前DOM節點的信息以及子節點信息進行節點分割, 完成信息塊提取。
2) 檢測分割條。首先利用網頁的初始坐標和終止坐標作為初始化分隔條, 然后利用頁面塊與分割條之間的位置關系生成新的檢測條。
3) 利用分隔條的權值重構語義塊, 沿著分隔條從低到高的方向進行迭代合并, 這樣最終將網頁分割成主題相關性很高的塊的集合。
2) 檢測分割條。首先利用網頁的初始坐標和終止坐標作為初始化分隔條, 然后利用頁面塊與分割條之間的位置關系生成新的檢測條。
3) 利用分隔條的權值重構語義塊, 沿著分隔條從低到高的方向進行迭代合并, 這樣最終將網頁分割成主題相關性很高的塊的集合。
上一篇:企業做網站網絡攻擊
下一篇:企業做網站從網站性質分析相關問題