仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
在自動提取描述過程中,文本中有些內容和物件非常重要,它們會直接影響到摘要的品質。 例如,標題中出現的關鍵字、詞的頻率、詞的位置、句子長度、句子結構以及排版特徵等,它們在自動生成描述的過程中,對摘要句的篩選、摘要的組織等發揮著重要作用,必須對它們深入體會,多加分析。
(1)詞頻
詞頻是指詞語在文本中出現的頻率。 思億歐強調,具有標引價值的詞彙往往是中頻詞,高頻詞一般是反映句子語法結構的虛詞,而低頻詞不適宜作為標引詞。 同樣,在摘要中發揮重要作用的詞彙也是具有較高頻率的關鍵字(重要詞),而這些詞在整個文章中屬於中頻詞。 通過對這些「中頻詞」的數量可以計算句子的權值來確定摘要候選句。
(2)標題
文本資訊的標題是文本內容的重要體現,文本的各級標題都不同程度地反映了文本所討論的主要內容。 因此,標題中的詞彙是摘要的重要素材,其中關鍵字和原文內容和討論主題往往有緊密的聯繫。 剔除了標題中的功能詞,餘下的關鍵字可作為抽取摘要句的「重要詞」。
(3)指示詞
文章中會有許多短語(詞彙)用於引申出反映文本內容的總結性的句子,這類短語或詞彙叫指示詞。 這類指示詞有如下形式:「本文論述了」、「本文的目的」、「綜上所述」等等,這些指示詞後所接的句子往往高度概括了文獻主題。 因此,這些句子被選作為摘要候選句的可能性非常大。
(4)位置
不同位置的句子對文章及段落的主題貢獻是不相同的,郴州SEO對此曾經有過些研究,我們認為:段落首句為段落主題句的概率達85%,位於段落末句的概率也達7%。 因此,這些位置的句子成為摘要句的可能性很大,在進行自動摘要的過程中,有必要提高處於這些特殊位置的句子的權值。
(5)句法結構
文章中的句子形式有多種多樣,有陳述句、疑問句、感歎句等等,但真正反映文章主題的主要還是陳述句,這也表明文章的摘要多以陳述句組成。 因此,選擇摘要句時,應盡可能地抽取陳述句,而應避免疑問句、感歎句等形式的句子進入摘要。
(6)句子長度
摘要表現為短和精,即以簡短的文字概括文章論述的主要內容。 因此,在選擇摘要句時,應選擇那些較為精練簡短的句子,過度冗長的句子通常不宜選人摘要中。
(7)網頁排版特徵
在網頁設計軟體日臻完善的前提下,對機讀文獻的排版格式也提出了很高的要求。 編者往往通過特殊格式突出文獻的主題內容,如加大字型大小、改為粗體或改為特殊字體,加底線、文字居中排列、加標號、增大縮進量、加陰影、加邊框、超級連結等。 確定詞或句的權值時,應考慮這些特殊的格式特徵,適當地將權值加大。
站內優化對於整個SEO專案來說,佔據非常大的比重。 外部連結只能是在7478.html">內部優化的基礎上起到錦上添花的作用。 觀點:搜尋引擎優化的重點就是考慮如何把網站做好,迎合搜尋引擎的規則,避免觸犯搜索演算法。
作者:街舞者(HTTP://www.jiewuzhe.com) 版權所有,如有轉載,請務必保留作者連結及本聲明!謝謝合作!