2022年搜索引擎研究報告

搜索引擎是基於網絡爬蟲、檢索排序、網頁處理、大數據處理、自然語言處理等技術,根據用戶需求與推薦算法,運用特定策略從互聯網海量信息中檢索出匹配信息反饋給用戶的檢索技術,爲用戶提供快速、高相關性的信息服務。

中國互聯網與移動互聯網的快速發展使中國網絡用戶的規模持續擴大,直接促進了搜索引擎用戶的不斷上升,進而強化了搜索引擎的媒體屬性。同時,互聯網日益成爲消費者獲取信息的主要渠道,廣告主的營銷預算與投入不斷向互聯網渠道及媒體轉移,搜索引擎作爲互聯網的主要流量入口,成爲廣告主互聯網廣告營銷與推廣的渠道選擇,使中國搜索引擎行業的廣告業務營收穩步增長,從而推動行業整體快速發展。

圖 搜索引擎產業鏈結構圖

資料來源:資產信息網 千際投行 iFinD

中國的搜索引擎公司主要有百度、搜狗、好搜、必應、360搜索、谷歌中國等。國際上主要有谷歌、微軟、蘋果、Yahoo、Ask、維基、DuckDuckGo、Aol、Yandex、Webcrawler、WolframAlpha等。

中國搜索引擎指數共包含5支成分股。企業總市值達到73155.28億元。企業員工總人數爲569,064人。

圖 搜索引擎產業鏈圖

資料來源:資產信息網 千際投行 iFinD

圖 搜索引擎營銷產業鏈全景圖

資料來源:資產信息網 千際投行 中信證券

在整個工業互聯網產業中,搜索引擎是處於產業鏈的下游位置。當工業互聯網將數據流數字化和信息識別後,再應用在搜索引擎中。但是在搜索引擎營銷產業鏈中,搜索引擎屬於產業鏈的中游。上游的廣告商將廣告投放在搜索引擎中,搜索引擎再將廣告呈現給觀衆。因此搜索引擎會受到工業互聯網發展、上游廣告商廣告投放和下游用戶等三個因素的影響。

搜索引擎的主流商業模式都是在搜索結果放置廣告,通過用戶的點擊向廣告商收取費用。國內的搜索引擎公司主要以競價排序爲其商業模式。根據廣告商付費排列的結果。廣告客戶在選擇和購買關鍵詞時要進行競價,根據競價的多少決定在針對某個關鍵詞進行搜索時的結果的排名先後順序。按照互聯網用戶的搜索習慣,他們一般不會點擊所有搜索結果,而通常點擊前十個搜索結果。因此,通過競價排名較前的企業將會有機會贏得更多直接客戶的訪問。

搜索引擎還可以以關鍵詞廣告爲盈利模式。廣告用戶針對自己產品的特點,向搜索引擎服務商選擇和購買相關的關鍵詞。當搜索與這些關鍵詞相關的內容時,廣告用戶的廣告將會與搜索結果同時出現,從而將廣告商的產品信息提供給互聯網用戶。隨着搜索引擎的發展,衆多的搜索引擎還組成了搜索引擎聯盟,也就是多家網站使用同一個搜索引擎服務商的搜索頁面。目前國內最有影響的搜索引擎聯盟是由中搜聯合5000多家網站組成的。

現在搜索引擎進行的工作原理主要分爲以下三個步驟:

· 搜索引擎蜘蛛訪問Web,進行網頁抓取;

· 對抓取來的網頁進行預處理,然後再建立索引;

· 在搜索界面進行查詢服務。

目前,常用的搜索引擎工具包含網絡爬蟲、索引建立、內容檢索、鏈接分析等相關技術。

爬蟲

· 批量型爬蟲:目標和範圍明確,目的實現立即停止;

· 增量型爬蟲:爲應對網頁不斷更新及時反應。

· 垂直型爬蟲:針對某個特定領域通過主題過濾。

· 暗網抓取:針對常規方式難以爬取到的網頁。

索引建立

(1)兩遍文檔遍歷:通過掃描文檔,將其包含的文檔收集到臨時數據集內,通過對關鍵字出現頻次及其在海量文檔中出現的全局信息進行統計,刻畫該關鍵字的整體描述。在獲取以上信息後,通過獲取空間,即全局信息索引大小,將倒排索引內容儲存起來並掃描遍歷,生成關鍵字優先排列表信息;

(2)排序法:用內存存放中間結果及字典信息,隨着新文檔的不斷增加,所佔用的內存會越來越多,爲了釋放內存,將排好序的序列清出內存放入磁盤,可以實現以固定內存對任意文檔集合創建索引;

(3)歸併法:除了數據字典以外的字典信息都會被清空並寫入磁盤,有效地避免後續索引被佔用的情況。

內容檢索

支撐搜索引擎對查詢結果的排序,體現爬取網頁和反饋結果的關聯。

鏈接分析

· 隨機遊走:從某個網頁以一定的概率跳轉到其所包含的鏈接;

· 子集傳播:依據規劃的傳播方式,分配給某子集特定的傳播需求,依次將權重傳遞給其他鏈接網頁。

圖 搜索引擎工作原理

資料來源:資產信息網 千際投行 知網

搜索引擎作爲工業互聯網的下游產業,伴隨着大數據、雲計算等互聯網技術的發展,搜索引擎也同樣會不斷髮展。未來搜索引擎將會更加關注結果的準確性和相關性,面向更開放、高效、更智能的趨勢發展,更加強調交互性和客戶友好程度。

圖 指數PE/PB

資料來源:資產信息網 千際投行 iFinD

圖 指數市場表現

資料來源:資產信息網 千際投行 iFinD

搜索引擎行業估值方法可以選擇市盈率估值法、PEG估值法、市淨率估值法、市現率、P/S市銷率估值法、EV企業價值法、EV/Sales市售率估值法、RNAV重估淨資產估值法、EV/EBITDA估值法、DDM估值法、DCF現金流折現估值法、紅利折現模型、股權自由現金流折現模型、無槓桿自由現金流折現模型、淨資產價值法、經濟增加值折現模型、調整現值法、NAV淨資產價值估值法、賬面價值法、清算價值法、成本重置法、實物期權、LTV/CAC(客戶終身價值/客戶獲得成本)、P/GMV、P/C(customer)、梅特卡夫估值模型、PEV等。

圖 主要上市公司估值對比

資料來源:資產信息網 千際投行 iFinD

圖 百度主營構成

資料來源:資產信息網 千際投行 天風證券

圖 微軟主營構成

資料來源:資產信息網 千際投行 第一證券

計算機技術發展

中國的計算機技術發展較快。搜索引擎與AI、大數據、雲計算等技術的發展息息相關。因此隨着中國計算機技術的不斷髮展,中國搜索引擎行業將會不斷髮展。

多產業的結合

行業內的頭部企業的主營業務都不僅只有搜索引擎,還有其餘業務。例如除了搜索引擎業務外,百度擁有愛奇藝、智能雲等業務,微軟擁有智能雲和個人電腦計算機等業務。隨着業務的拓展,這些公司會擁有更多的數據流,增強對搜索引擎相關性和精確性的發展。

表 常見行業風險因子

資料來源:資產信息網 千際投行

圖 2022年中國搜索引擎Top10

資料來源:資產信息網 千際投行

SWOT分析

· 優勢:行業壁壘高。目前國內處於寡頭市場,百度、必應、IE、搜狗、有道、谷歌等企業掌握大多數的市場。進入行業需要很高的知名度,高投入,且技術需求高。

· 劣勢:研發投入成本高。例如2020年百度研發投入高達195.1億,同比增長6.3%,領先其他互聯網頭部公司,百度中國AI專利申請量第一,在深度學習、自然語言處理、語音、智能駕駛等呈現出明顯優勢。

· 機會:其他業務聯合搜索引擎業務一同發展,擴展業務範圍。

· 威脅:暫無。

中國搜索引擎行業與國際企業比較

目前國內的搜索引擎以百度爲主。其他搜索引擎的市佔率較低。我國搜索引擎用戶規模達7.95億人次,使用率爲78.7%,從國內搜索引擎佔有率數據來看,百度依然牢牢佔據龍頭地位,PC端市場佔比81.26%,移動端市場佔比80.62%。

國外市場以谷歌的Chorme瀏覽器爲主。目前,Chrome瀏覽器市佔率66.64%,遙遙領先;Microsoft Edge市佔率10.07%,Safari市佔率9.61%。

2022Q1板塊下行且波動性較大,受到疫情影響,廣告業務承壓,導致搜索引擎公司的股價出現下跌和波動較大的趨勢。

百度行情覆盤與財務狀況

圖 PE/PB Bands

資料來源:資產信息網 千際投行 iFinD

谷歌行情覆盤與財務狀況

圖 PE/PB Bands

資料來源:資產信息網 千際投行 iFinD

中國主要企業有百度 [BIDU.O]、[000708.SZ]、本站[NTES.O]等。

圖 美股主要公司

資料來源:資產信息網 千際投行 iFinD

百度 [BIDU.O]:是擁有強大互聯網基礎的領先AI公司。百度願景是:成爲最懂用戶,並能幫助人們成長的全球頂級高科技公司。百度擁有數萬名研發工程師,這是中國乃至全球都頂尖的技術團隊。這支隊伍掌握着世界上最爲先進的搜索引擎技術,使百度成爲中國掌握世界尖端科學核心技術的中國高科技企業,也使中國成爲美國、俄羅斯、和韓國之外,全球僅有的4個擁有搜索引擎核心技術的國家之一。

本站[NTES.O]:是中國領先的互聯網技術公司。 在開發互聯網應用、服務及其它技術方面,始終保持中國業界領先地位。本着對中國互聯網發展強烈的使命感,締造美好生活的願景,本站利用最先進的互聯網技術,加強人與人之間信息的交流和共享。

全球非中國主要企業有蘋果[AAPL.O]、微軟[MSFT.O]、谷歌[GOOG.O]等。英國的搜索引擎 abrexa、SearchEngine、Splut;德國的搜索引擎 Yabba!、Wlw、Acoon、Bellnet、Fireball;俄羅斯的搜索引擎 Yandex、Rambler、Akavita、All、meta;馬來西亞的搜索引擎 New Malaysia、Cari!;葡語的搜索引擎 uol、Cusco;韓語的搜索引擎 Naver;日語的搜索引擎 Goo、Ceek;西班牙的搜索引擎 Apali、Ciao;瑞士的搜索引擎 Blinde-kuh、Abacho、cnous、helles-koepfab,意大利的搜索引擎 Godado等。

圖 美股主要上市企業

資料來源:資產信息網 千際投行 iFinD

蘋果[AAPL.O]:蘋果公司於1977年1月3日根據加利福尼亞州法律註冊成立。公司設計,製造和銷售智能手機,個人計算機,平板電腦,可穿戴設備和配件,並提供各種相關服務。

微軟[MSFT.O]:微軟公司成立於1975年4月4日。公司開發和支持軟件,服務,設備和解決方案,這些軟件,服務,設備和解決方案可爲客戶帶來新價值,並幫助個人和企業充分發揮其潛力。公司提供一系列服務,包括基於雲的解決方案,爲客戶提供軟件,服務,平臺和內容,並且公司提供解決方案支持和諮詢服務。

谷歌C[GOOG.O]:Alphabet Inc. 是谷歌(Google)及谷歌旗下各個子公司的控股公司,於2015年進行重組成立。谷歌於1998年9月4日在加利福尼亞成立,於2003年8月在特拉華州重新註冊成立。Alphabet涉足各個領域,包括技術,生命科學,資本投資和研究。其子公司包括Google,Calico,GV,Google Capital,Google Fiber等等。谷歌公司致力於互聯網搜索、雲計算、廣告技術等領域,開發並提供大量基於互聯網的產品與服務。

技術發展推動行業發展

中國的計算機技術發展較快。搜索引擎與AI、大數據、雲計算等技術的發展息息相關。因此隨着中國計算機技術的不斷髮展,中國搜索引擎行業將會不斷髮展。

多產業的結合

行業內的頭部企業的主營業務都不僅只有搜索引擎,還有其餘業務。例如除了搜索引擎業務外,百度擁有愛奇藝、智能雲等業務,微軟擁有智能雲和個人電腦計算機等業務。隨着業務的拓展,這些公司會擁有更多的數據流,增強對搜索引擎相關性和精確性的發展。

Cover Photo by Sherise VD on Unsplash