一個(gè)合格的SEO人員需要對(duì)搜索引擎的結(jié)構(gòu)有一定的了解,這樣在進(jìn)行SEO時(shí),他可以消息靈通、井然有序,而不必拘泥于固定的優(yōu)化方法和技能。此時(shí),要分析的索引器是搜索引擎結(jié)構(gòu)的重要組成部分。
www.dmd.org.cn
接下來(lái),讓我們系統(tǒng)地了解索引器的功能。索引器的功能是理解搜索者搜索到的信息(我在上一頁(yè)發(fā)表了一篇介紹),分析收集到的網(wǎng)頁(yè),并提取相關(guān)網(wǎng)頁(yè)信息,如網(wǎng)頁(yè)關(guān)鍵字、網(wǎng)頁(yè)使用代碼、網(wǎng)頁(yè)URL等。然后,通過(guò)搜索引擎的相關(guān)算法進(jìn)行大量復(fù)雜的計(jì)算,獲取一些相關(guān)信息,然后利用這些相關(guān)信息建立相應(yīng)的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。
科遠(yuǎn)網(wǎng)絡(luò)助力互聯(lián)網(wǎng)營(yíng)銷一體化服務(wù)
1、 索引項(xiàng) 科遠(yuǎn)網(wǎng)絡(luò)-分享優(yōu)質(zhì)信息
通過(guò)前面的介紹,你必須了解一些索引器的知識(shí)。有必要了解以下索引項(xiàng)。什么是索引條目?例如,我們通常所說(shuō)的索引器、索引時(shí)間、代碼、作者、標(biāo)題等都屬于索引項(xiàng)。
廊坊科遠(yuǎn)網(wǎng)絡(luò)
索引項(xiàng)可分為兩類:目標(biāo)索引項(xiàng)和內(nèi)容索引項(xiàng)。目標(biāo)索引項(xiàng)與文檔內(nèi)容無(wú)關(guān)。例如,當(dāng)我們發(fā)送一篇文章時(shí),作者、時(shí)間和地址都是客觀的索引項(xiàng);內(nèi)容索引項(xiàng)反映文檔的內(nèi)容,易于理解。這里沒(méi)有例子。內(nèi)容索引可分為單索引項(xiàng)和多索引項(xiàng)。
科遠(yuǎn)網(wǎng)絡(luò)助力互聯(lián)網(wǎng)營(yíng)銷一體化服務(wù)
2、 對(duì)SEO的啟示 www.dmd.org.cn
根據(jù)以上對(duì)搜索引擎索引器原理的分析,我們可以大致判斷搜索引擎的技術(shù)成熟度。例如,據(jù)說(shuō)百度會(huì)在5分鐘內(nèi)自動(dòng)更新新聞。如果網(wǎng)站是新聞信息,我們可以注意信息的實(shí)時(shí)發(fā)布;在確定網(wǎng)站的核心關(guān)鍵詞和關(guān)鍵詞時(shí),根據(jù)中文分詞的原則,去除冗余詞,將網(wǎng)站的核心關(guān)鍵詞反饋給搜索引擎,使搜索引擎給網(wǎng)站一個(gè)好的排名。
廊坊科遠(yuǎn)網(wǎng)絡(luò)
3、 中文分詞
www.dmd.org.cn
提供中文分詞,你會(huì)想到世界上較大的中文搜索引擎百度,因?yàn)榘俣人阉饕嬖谥形姆衷~方面擁有深厚的技術(shù)。一般來(lái)說(shuō),在用搜索引擎為英語(yǔ)單詞或句子編制索引時(shí),提取更容易,因?yàn)橛⒄Z(yǔ)單詞是用空格分隔的,所有這些都是常規(guī)做法。但是對(duì)于用中文寫(xiě)的句子,我們不能用空格來(lái)區(qū)分。我們必須分詞,也就是我們經(jīng)常說(shuō)的分詞。
中文分詞是文本抽取的基礎(chǔ)。對(duì)于輸入的中文段落,進(jìn)行中文分詞,然后搜索引擎可以識(shí)別句子的意思。
一般來(lái)說(shuō),中文分詞有兩種方法,一種是機(jī)械匹配法(基于字符串匹配的分詞方法),另一種是概率統(tǒng)計(jì)法。其中,機(jī)械匹配是在現(xiàn)有詞典的基礎(chǔ)上進(jìn)行的,即通過(guò)與詞典中的單詞進(jìn)行匹配得到的分詞結(jié)果。其常用的分詞方法包括:正向匹配法(從左到右)、反向匹配法(從右到左)、最小切分法(以盡量減少每個(gè)句子中切掉的單詞數(shù))和雙向匹配法(從左到右和從右到左掃描)。概率統(tǒng)計(jì)的方法是通過(guò)概率統(tǒng)計(jì)得到分詞,然后進(jìn)行處理。