摘要:通信工程師終端與業(yè)務(wù)技術(shù)模式:要以最快的速度提供最精確的搜索結(jié)果,則需要一種全新的服務(wù)器設(shè)置。大多數(shù)的搜索引擎依靠少量大型服務(wù)器,這樣,在訪問高峰期速度就會減慢,而Google在全球部署數(shù)十萬臺服務(wù)器,并自行設(shè)計構(gòu)建了超級計算機系統(tǒng),能夠在多個數(shù)據(jù)中心之間傳輸數(shù)據(jù),并能夠在半秒鐘之內(nèi)同時對千萬個搜索請求做出應(yīng)答。這一創(chuàng)新技術(shù)成功地縮短了響應(yīng)時間,提高了可擴展性,并降低了成本。
2.2.3 技術(shù)模式
1.服務(wù)器技術(shù)
要以最快的速度提供最精確的搜索結(jié)果,則需要一種全新的服務(wù)器設(shè)置。大多數(shù)的搜索引擎依靠少量大型服務(wù)器,這樣,在訪問高峰期速度就會減慢,而Google在全球部署數(shù)十萬臺服務(wù)器,并自行設(shè)計構(gòu)建了超級計算機系統(tǒng),能夠在多個數(shù)據(jù)中心之間傳輸數(shù)據(jù),并能夠在半秒鐘之內(nèi)同時對千萬個搜索請求做出應(yīng)答。這一創(chuàng)新技術(shù)成功地縮短了響應(yīng)時間,提高了可擴展性,并降低了成本。
2.搜索技術(shù)
1)PageRank技術(shù)
PageRank(網(wǎng)頁級別)技術(shù)是Google的兩位創(chuàng)始人發(fā)明的技術(shù),它是一種由搜索引擎根據(jù)網(wǎng)頁之間相互的超鏈接關(guān)系計算網(wǎng)頁級別的技術(shù),Google用它對網(wǎng)頁的相關(guān)性和重要性做出評價。Page Rank技術(shù)并不是簡單地計算直接鏈接的數(shù)量,而是把從A頁面到B頁面的鏈接解釋為A頁面給B頁面的投票,根據(jù)A頁面和B頁面的級別來決定B頁面新的級別。一個頁面的PageRank是由鏈接它的頁面數(shù)量和重要性經(jīng)過遞歸算法計算得到的。Google技術(shù)使用網(wǎng)上反饋的綜合信息來確定某個網(wǎng)頁的重要性,搜索結(jié)果沒有人工預(yù)或操縱,這使Google成為一個廣受用戶信賴、不受付費排名影響的信息來源。
2)超文本匹配分析技術(shù)
Google的超文本匹配分析技術(shù)不但掃描基于網(wǎng)頁的文本內(nèi)容,而且分析網(wǎng)頁的全部內(nèi)容、字體、分區(qū)及每個文字精確位置等因素,同時Google還分析相鄰網(wǎng)頁的內(nèi)容,以此來確保返回與用戶查詢最相關(guān)的結(jié)果。
3.廣告相關(guān)性投放實現(xiàn)技術(shù)
Google爬蟲對廣告逋示頁進行爬取,首先對網(wǎng)頁進行降噪處理,通過信息塊之間的關(guān)聯(lián)找到正文所在的信息塊,剔除導(dǎo)航、廣告、版權(quán)信息等無用信息塊。得到正文塊后,對正文進行分詞處理,得到關(guān)鍵詞序列。最后利用已經(jīng)通過機器學(xué)習(xí)技術(shù)獲得的每個分類在特征空間上的聚類中心進行計箅,得出該網(wǎng)頁屬丁某個分類的概率。對于高出一定分類閾值的網(wǎng)頁投放相關(guān)分類下的廣告。
4.作弊點擊分析技術(shù)
Google并+是單純使用編程技巧如檢査IP是否重復(fù)來判斷作弊點擊,而是把所有的點擊及頁面訪問歷史信息都記錄下來,保存到一個設(shè)計良好的點擊流數(shù)據(jù)倉庫中。對數(shù)據(jù)倉庫中的數(shù)據(jù)進行數(shù)據(jù)挖掘得到由多個因素參與的計算模型,最后給出一次點擊成為作弊點擊的概率,通過當(dāng)前閾值來過濾作弊點擊。這些參與因素包括整體點顯比、單IP點敁比、時間段因素、時間差因素(網(wǎng)頁的顯示和點擊廣告間的時間差,以及廣告打幵和關(guān)閉的時間差)等。
5.地圖搜索技術(shù)
Google地閣是一項網(wǎng)絡(luò)地圖服務(wù),通過使用Google地圖,用戶了以查詢詳細地址、尋找周邊信息、商戶信息,并規(guī)劃點到點路線。Google地圖的工作原理是:Google每隔1-2年通過民用衛(wèi)塱拍攝地球的圖片傳到服務(wù)器上,通過軟件把圖片的坐標(biāo)轉(zhuǎn)換成地圖的經(jīng)緯度,經(jīng)過處理把相關(guān)數(shù)據(jù)存放在服務(wù)器的數(shù)據(jù)庫里,當(dāng)用戶搜索地圖時,Google用程序來讀取服務(wù)器數(shù)據(jù)庫的相關(guān)數(shù)據(jù),經(jīng)過篩選把符合用戶需要的結(jié)果反饋到客戶端。
Google地圖對坐標(biāo)的控制比較寬松,不對坐標(biāo)進行加密,而且Google地圖搜索請求不僅僅支持HTML輸出,而且還支持JSON和KML等輸出,給程序整合帶來便利。
6.視頻搜索技術(shù)
Google的視頻搜索漫游器會定期抓取中國的熱門視頻網(wǎng)站,將這些網(wǎng)頁納入索引并掃描其中的視頻,Google使用先進的抓取技術(shù)分析視頻旁的文字、視頻標(biāo)題和其他數(shù)十種因素,以確定視頻內(nèi)容。Google還使用復(fù)雜的算法刪除重復(fù)視頻,確保在搜索結(jié)果中先展示質(zhì)量較高的視頻。
返回目錄:
編輯推薦:
通信工程師考試終端與業(yè)務(wù)培訓(xùn)營銷文案寫作匯總
通信工程師備考資料免費領(lǐng)取
去領(lǐng)取