信息檢索論文 [一種基于網(wǎng)頁分割的Web信息檢索方法]
發(fā)布時間:2020-03-07 來源: 短文摘抄 點擊:
[摘要]提出一種基于網(wǎng)頁內(nèi)容分割的web信息檢索算法。該算法根據(jù)網(wǎng)頁半結(jié)構(gòu)化的特點,按照HTML標(biāo)記和網(wǎng)頁的內(nèi)容將網(wǎng)頁進(jìn)行區(qū)域分割。在建立HTML標(biāo)記樹的基礎(chǔ)上,利用內(nèi)容相似性和視覺相似性進(jìn)行節(jié)點的整合。在檢索和排序中,根據(jù)用戶的查詢,充分利用區(qū)域信息來對相關(guān)的檢索結(jié)果進(jìn)行排序。
[關(guān)鍵詞]網(wǎng)頁分割 信息檢索 HTML標(biāo)記 相似性
[分類號]TP391
注:“本文所涉及到的圖表、注解、公式等內(nèi)容請以pdf格式閱讀原文”。
相關(guān)熱詞搜索:分割 信息檢索 網(wǎng)頁 一種基于網(wǎng)頁分割的Web信息檢索方法 信息檢索方法 一種基于網(wǎng)頁分割的web
熱點文章閱讀