HTML Image Alt 全攻略!掌握簡單四原則讓百度輕松看懂你的圖片!
我很想知道你的搜索引擎算法那一章的理論是哪里來的,有什么依據(jù),怎么見得搜索引擎就是依據(jù)這樣的原理,例如:“去停止詞 去停止詞 去停止詞 去停止詞無論英文中文,頁面內容中都會有一些出現(xiàn)頻率很高,卻對內容沒有任何影響的詞,如“的”,“地”,“得”之類的助詞,“啊”,“哈”,“呀”之類的感嘆詞,“從而”,“以”,“卻”之類的介詞。這些詞被稱為停止詞,因為它們對頁面主要意思沒什么影響。英文中的常見停止詞如the,a,an,to,of等。搜索引擎在索引頁面之前會去掉這些停止詞,使索引數(shù)據(jù)主題更為突出,減少無謂的計算量?!蔽蚁胫劳V乖~都去了,我百度或者google搜索“的,地,得”是不是出現(xiàn)一個空白頁面?你可以參考當年GG創(chuàng)始人寫的GG原理論文,網上還有很多搜索引擎技術文獻。書里描述的是基本和簡化的原理,真正算法當然要復雜得多,一定會考慮到各種特殊情況,比如你說的搜索詞只是個停止詞。搜索引擎里大把的PhD,整天不就琢磨改進代碼嗎。
2023年08月23日