企億推信息網(wǎng)
        專注網(wǎng)絡(luò)推廣服務(wù)

        搜索引擎的智能化對于百度、360、搜狗無疑是巨大的技術(shù)更新

        總體而言,搜索引擎面臨以下挑戰(zhàn)。

        1、頁面爬行需要快速且全面

        互聯(lián)網(wǎng)是一個動態(tài)的內(nèi)容網(wǎng)絡(luò)。每天,無數(shù)的頁面被更新和創(chuàng)建,無數(shù)的用戶發(fā)布內(nèi)容并相互交流,要返回到有用的內(nèi)容,搜索引擎需要抓取新的頁面,但是由于頁面數(shù)量巨大,搜索引擎蜘蛛需要很長時間才能更新數(shù)據(jù)庫中的頁面一次。當搜索引擎誕生時,捕獲和更新周期通常以月為單位進行計算,這就是為什么谷歌在2003年之前每個月都有一個大的更新。

        現(xiàn)在主流的搜索引擎已經(jīng)能夠在幾天內(nèi)更新重要的頁面,并且在幾小時甚至幾分鐘內(nèi)將包括在高權(quán)重網(wǎng)站上的新文檔。然而,這種快速的包含和更新只能局限于高權(quán)重的網(wǎng)站,許多頁面在幾個月內(nèi)沒有被重新爬行和更新也是很常見的。

        為了返回比較好的結(jié)果,搜索引擎還必須盡可能全面地抓取一個頁面,這需要解決許多技術(shù)問題,有些網(wǎng)站不利于搜索引擎蜘蛛爬行和爬行,如網(wǎng)站鏈接結(jié)構(gòu)的缺陷、Flash、Java腳本的廣泛使用,或者用戶在訪問該部分之前必須登錄的內(nèi)容,都增加了搜索引擎爬行內(nèi)容的難度。

        2、海量數(shù)據(jù)存儲

        一些大型網(wǎng)站在一個網(wǎng)站上有數(shù)百萬、數(shù)千萬、甚至數(shù)億的頁面,你可以想象網(wǎng)絡(luò)上所有網(wǎng)站的頁面加起來有多少數(shù)據(jù),搜索引擎蜘蛛抓取頁面后,還必須有效地存儲這些數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)必須合理,具有很高的可擴展性,對寫入和訪問速度的要求也很高。

        除了頁面數(shù)據(jù),搜索引擎還需要存儲頁面之間的鏈接和大量的歷史數(shù)據(jù),這是用戶無法想象的。據(jù)估計,百度擁有340多萬臺服務(wù)器,谷歌擁有數(shù)十個數(shù)據(jù)中心和數(shù)百萬臺服務(wù)器,這種大規(guī)模的數(shù)據(jù)存儲和訪問不可避免地會面臨許多技術(shù)挑戰(zhàn)。

        我們經(jīng)常在搜索結(jié)果中看到排名上下波動,沒有明顯的原因,我們甚至可以刷新頁面并查看不同的排名,有時,網(wǎng)站數(shù)據(jù)也會丟失,這可能與大規(guī)模數(shù)據(jù)存儲和同步的技術(shù)難點有關(guān)。

        搜索引擎的智能化對于百度、360、搜狗無疑是巨大的技術(shù)更新(圖1)

        3、索引處理快速、有效且可擴展

        在搜索引擎對頁面數(shù)據(jù)進行爬行和存儲后,還需要進行索引處理,包括鏈接關(guān)系計算、正向索引、反向索引等。由于數(shù)據(jù)庫中的頁面數(shù)量龐大,執(zhí)行pr等迭代計算既費時又費力,為了提供相關(guān)及時的搜索結(jié)果,只需抓取是沒有用的,同時也需要做很多的索引計算,因為在任何時候都會添加新的數(shù)據(jù)和頁面,所以索引處理也應(yīng)該具有良好的可伸縮性。

        4、快速準確的查詢處理是普通用戶能看到的搜索引擎步驟

        當用戶在搜索框中輸入一個查詢并單擊“搜索”按鈕時,他通常會在不到一秒鐘的時間內(nèi)看到搜索結(jié)果。簡單的表面處理實際上涉及非常復(fù)雜的背景處理。在后的查詢階段,比較重要的問題是如何在不到一秒鐘的時間內(nèi)從數(shù)、數(shù)百萬甚至數(shù)千萬個包含搜索詞的頁面中快速找到比較合理、相關(guān)的頁面,并根據(jù)相關(guān)度和權(quán)限進行排列。

        5、判斷用戶意圖和人工智能

        應(yīng)該說,搜索引擎的前四個挑戰(zhàn)已經(jīng)能夠更好地解決,但是對用戶意圖的判斷還處于初級階段。不同的用戶搜索相同的查詢詞,可能會查找不同的內(nèi)容。例如,在搜索“蘋果”時,用戶是想知道蘋果的果實,還是蘋果電腦,還是想知道電影“蘋果”的信息?或者他想聽“蘋果”?沒有上下文,沒有對用戶的個人搜索習慣的理解,他就無法判斷。

        搜索引擎目前正在根據(jù)用戶的搜索習慣、歷史數(shù)據(jù)的積累和語義搜索技術(shù)來判斷搜索意圖、理解文檔的真實含義和返回更相關(guān)的結(jié)果。

        未經(jīng)允許不得轉(zhuǎn)載:啟新網(wǎng)站SEO優(yōu)化 » 搜索引擎的智能化對于百度、360、搜狗無疑是巨大的技術(shù)更新
        分享到: 更多 (0)
        加載中~
        成人国产精品一区二区网站| 精品真实国产乱文在线| 国产无套精品一区二区| 精品特级一级毛片免费观看| 国产精品美女一级在线观看| 国产啪精品视频网免费| 91精品国产福利在线观看麻豆 | 精品人妻va出轨中文字幕| 国产精品一区二区久久不卡| 国产精品无打码在线播放| 精品一区中文字幕| 亚洲日韩精品无码AV海量| 国产午夜精品1区2区3福利| 最新国产精品自拍| 成人国产精品一区二区网站公司| 国产精品天天看大片特色视频| 精品国精品无码自拍自在线| 久久久久久久精品妇女99 | 国产精品无码aⅴ嫩草| 国内揄拍国内精品少妇国语| 亚洲精品第一国产综合亚AV| 亚洲国产精品综合久久20| 1717国产精品久久| 中文精品久久久久国产网址| 91在线亚洲精品专区| 91大神在线精品网址| 久久精品国产亚洲αv忘忧草 | 亚洲精品国产日韩| 亚洲av日韩综合一区在线观看| 日韩人妻无码精品系列| 日韩日韩日韩手机看片自拍 | 亚洲精品无码永久在线观看你懂的 | 亚洲国产精品专区| 久久久精品人妻一区二区三区蜜桃 | 久久久久人妻一区精品性色av| 青青青国产精品一区二区| 日韩精品久久无码人妻中文字幕| 久久国产精品久久久久久 | 一个人免费日韩不卡视频| 亚洲处破女AV日韩精品| 日韩一区二区视频在线观看|