電影《末日重啟》中有這樣一句臺詞:“你有沒有想過,世界上還存在一個鏡像世界,那里的一切都和你的生活一樣,就像我們熟知的平行時空那樣。”
在這樣一個特殊的時間點,或許已經有不少人開始思索這個問題,如果我們可以從“鏡像世界”看到自己,如果我們可以在兩個多月前叫停那些吃“野味”的人群,社會就不會停擺,我們的生活也不會被外力打亂。
然而現實世界中可能并不缺少這樣的“平行時空”。
兩個多禮拜前,華南農業大學公布了最新的研究成果,穿山甲正是新型冠狀病毒的潛在中間宿主。但在更早前的一個禮拜,百度發布的搜索大數據報告顯示,穿山甲雄踞過去十年中“野味搜索”的第一位,類如“野味的做法”和“野味館”的百度搜索大數據同樣呈現出較為明顯的季節性波動,這說明即使經歷非典之后,依然有人對吃野味這件事情有獨鐘。
從中不難梳理出潛在的因果關系:搜索作為用戶主動獲取信息的方式,所產生的搜索大數據直觀地暴露了民眾對于“野味”的熱情,隱藏在這些數據背后的用戶行為,正是為疫情爆發而種下的“因“。
拋卻疫情這般沉重的話題,保留一些“私心”將目光看向商業世界,看到的卻是企業家、創業者們的“訴苦”,諸如“現金流只能維持三個月”“給員工發不出工資”之類的聲音比比皆是,而非嘗試從現實世界的“鏡像”里尋找活下去的答案,思索“黑天鵝”可能帶來的新機會。
本文想要討論的正是這樣一個話題。
01 “搜索直接連接大腦”
“搜索直接連接大腦”,谷歌聯合創始人謝爾蓋·布林提出的概念被不少人解讀,甚至有人猜測谷歌一開始就想打造連接人與世界的“腦機”。
或許無須這般深奧的猜測,谷歌不止一次對外宣稱:“搜索的最終目標是理解人的意思”,沒準這就是謝爾蓋·布林的題中之意。厘清了搜索引擎的價值,也就不難理解搜索數據由少變多,再到大數據的現實意義。
首先,谷歌和百度的主頁大概是互聯網世界中最簡單的UI,有人給出的解釋是“偶然性”的產物,搜索引擎誕生的時間還是撥號上網的年代,為了保證網頁加載的速度,以及節省服務的流量成本,最簡單的選擇無疑是最好的選擇。
暫且不去論證此類說法的正確性,簡單到極致的搜索框恰恰是破解“搜索直接連接大腦”的關鍵所在。當用戶面對這樣的搜索框時,看不到太多的干擾因素,由此養成的習慣就是:在搜索框里輸出自己想要答案的關鍵詞,一種最原始也最純粹的“主動尋找信息”的場景。何況人們并不缺少雅虎這樣包括搜索框的門戶或導航網站,為用戶提供了這樣或那樣的選擇,最終卻和PC時代一起走向了衰落。
其次,人們的每一次請求,搜索引擎都知道人們在尋找什么,正如人們的所有行為都會在互聯網上留下痕跡,而搜索引擎占領了捕捉和分析這一行為的最佳路徑,針對這些用戶行為的抓取、存儲和分析,甚至可以揣摩用戶搜索之前的動機來洞察新的趨勢,指引下一階段的走向。
即便到了移動互聯網時代,超級APP逐漸崛起,數據孤島逐漸形成,“投喂”模式的內容分發已經成為新潮流,可搜索仍然是最高頻的用戶行為之一。谷歌在全球范圍內的月活用戶超過了10億人次,國內每天也有10 億人次通過百度搜索了解疫情,同時移動互聯網又進一步擴展了搜索引擎的能力邊界,除了搜索的關鍵詞,還有搜索的地點、設備、方式,數據不僅在增“大”,也在變“深”。
之所以用如此長的篇幅來闡述搜索的意義,無非是想要回答這樣一個問題:記憶和聯想是大腦最重要的兩種思維方式,記憶是互聯網的優勢所在,聯想的路徑是什么?這也就引出了搜索大數據的價值,即洞察、預測、研判……
畢竟搜索作為網民的“意圖數據庫”,當然可以根據某一專題搜索大數據的的漲跌,預測下一步的市場走勢。
02 “像上帝一樣俯視”
搜索大數據的“一戰成名”,還要從谷歌的GFT說起。
2008年谷歌推出了一個名為Google Flu Trends的應用,翻譯成中文就是“谷歌流感趨勢”,通過匯總分析用戶的搜索數據,對全球的流感疫情進行估測。2009年美國H1N1流感爆發的幾周前,谷歌的工程師們在《Nature》上發表了一篇論文,預測了H1N1在美國的傳播,并且具體到了特定的地區,事后證明與美國疾病控制和預防中心(CDC)的官方數據相關性高達97%,時間上卻提前了整整兩周。
只是谷歌的GFT也有“玩砸”的時候。
2014年有研究人員在《Science》上發表文章指責GFT的糟糕表現,文章的標題相當直接——“谷歌流感的寓言:大數據分析的陷阱”。原因在于,2011年8月到2013年8月之間的108周里,GFT有100周的流感發病率預測高過CDC,2012年到2013年的預測發病率已是CDC報告值的2倍多。
不過這并不是唱衰搜索大數據的理由。
打這樣一個比方:在一個交通流量密集的十字路口,實時記錄行駛過的車輛和發生的交通事故,如果上禮拜一的車流量是1萬輛,不難在下個禮拜一記錄到大致相同的數字;可如果上禮拜一發生了兩起交通事故,很難說下個禮拜一定會發生交通事故,因為交通事故是不確定性事件。
簡而言之,搜索大數據在不確定性、隨機性事件中的預測可能會出現不小的偏差,但對確定性、趨勢性的事件,幾乎可以用“研判”一詞來形容。
直接的例子就是有人用Google趨勢多次成功預測了比特幣的價格走勢,畢竟加密貨幣的價格變化直接取決于外界的關注度,當用戶搜索比特幣正面關鍵詞的標準差增加時,預示著比特幣的價格將有所上升,而負面關鍵詞的標準差增加時,往往會在一段時間后出現價格下降的情況。
國內也不乏這樣的例子。
比如在線教育的百度搜索大數據在今年春節后不久就開始猛漲,這比在線教育概念股的瘋漲足足提前了兩個禮拜左右??梢越o出的合理解釋是:1月23日武漢封城的消息曝出后,一些家長就開始焦慮孩子開學的問題,在線教育相關關鍵詞的搜索量開始迅速增長。
此外,疫情的消息傳出后,新型冠狀病毒肺炎癥狀之一“咽喉痛”的關鍵詞搜索開始呈現出上升趨勢,折射了人們對于自身情況的擔憂,可能會引發焦慮情緒和心理健康問題。對于內容生產者和平臺方,及時辟謠并加大權威信息、科普信息的權重,可以說是防疫過程中必要的一個環節......
假如人們可以在黑天鵝出現之前,對市場的走向做出準確的洞察,或許可以像上帝一樣俯視亂象中的危與機,而非無奈的“訴苦”。
03 不應被忽略的金礦
關于大數據價值的“警示”,幾乎成了老調常談的話題。
早在1980年,著名未來學家阿爾文·托夫勒就在《第三次浪潮》中,將“大數據”描繪為“第三次浪潮的華彩樂章”。
2012年,IBM CEO羅睿蘭的觀點更為直接:“大數據不亞于一種新的自然資源。數據在我們當今時代的角色就像是蒸汽、電磁和化石燃料對之前時代的角色一樣。它有潛力推動更高一層的社會進步和繁榮。”
也正是在2012年,美國、歐洲、日本、韓國等先后啟動了政府帶頭的大數據研究與開發計劃,國內也在當年的“十二五”規劃中明確提出要支持海量數據存儲、處理技術的研發和產業化。
只是大數據在國內的用戶基礎似乎還很貧瘠:微信每年都會放出一份大數據報告,告訴我們什么是最受歡迎的年度表情;支付寶每年都會公布一份年度賬單,用數據詮釋過去一年中花了多少錢,花在了什么地方;至于百度搜索大數據的應用,可能是不少營銷人的必備工具,更廣闊的B端市場對其的關注度還有不小的增長空間。
比如手機廠商已經習慣于從搜索大數據中追蹤輿情,然后根據用戶的喜好制定相應的市場營銷計劃,卻沒有耐心從億萬用戶的搜索大數據中挖掘產品痛點在哪里,反而喜歡從幾千人規模的調研數據里找答案。
再比如提到經典的數據應用案例時,很多人想到的還是沃爾瑪“啤酒與尿布”,也折射了當下零售商的窘境:執著于在自家的倉庫數據中找到可能的商品關聯,如果進一步分析搜索啤酒的用戶背后的動機是什么、還會搜索哪些商品,是否會制造更多的可能?
另一個現實而迫切的問題是,疫情期間每天有超過10億人次在用百度搜索獲取信息,沉淀了海量的用戶數據,這些用戶們出于什么樣的需求,基于什么樣的訴求?幸運的是,已經有不少人嘗試從野味、口罩等數據中給出了一些洞察,可這些疫情期間的搜索數據如何優化社會治理體系,如何預防下一次疫情的出現,還需要進一步下功夫挖掘。
就像疫情期間同時發生的生鮮搶購和農產品滯銷,對這些數據進一步挖掘整理,是否可以對供應鏈的調整給出科學的指導;不同地區的醫學關鍵詞搜索情況和當地的醫療體系進行關聯分析,或許可以以遠程診療的形式彌補醫療資源分配不均衡的問題;以及不同地區“口罩”、“消毒水”等防疫用品的搜索情況,大致可以洞察出當地的需求強弱,引導政府調整醫療物資的分配......
至少對站在產業轉折點上的中小企業而言,在現金流遠不能和巨頭匹敵的局限下,搜索大數據這座金礦可能是拉平差距的唯一籌碼,誰能掌握挖掘大數據的“黑魔法”,無疑將在競爭中多一些勝算。
04 寫在最后
“鏡像世界”并不是科幻電影的專屬,而是耶魯大學計算機科學家David Gelernter在1991年提出的概念。
彼時給“鏡像世界”下的定義是:鏡像世界是將一些巨大的結構性的運動的真實生活,像鏡像圖景一樣嵌入到電腦中,通過它你能看到和理解這個世界的全貌。長達30年時間的科技演進,現實世界正在1:1映射變成數字社會,特別是在物聯網的推進下,整個世界都在“可讀化”,“鏡像世界”已然從概念成了現實。
其中搜索大數據正是“鏡像世界”的組成部分之一,或許我們還不能從人類的尺度觀察世界,但從商業的尺度來洞察潛在的機會點,并不缺少一定的可行性。正如那句有些雞湯性質但不失哲理的話:當你改變了看世界的方式,你就改變了你所看到的世界。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
隨著數字中國戰略的步步落實,大數據已經成為錨定戰略定位、搶得市場先機的重要基礎元素。為彰顯行業發展現狀,遴選、推薦優秀企業,長城戰略咨詢近日在2023中國國際大數據產業博覽會期間,重磅發布《中國大數據獨角獸企業榜單》,根據獨角獸企業國家推薦性標準,篩選出259家2022年中國大數據(潛在)獨角獸企業
2023年6月15日至18日,2023北京健康醫療大數據論壇、醫促會華夏健康數據與數字醫學高峰論壇、第三屆中華預防醫學會腎臟病預防與控制專業委員會學術會議將同期于北京舉行。論壇以“學術引領數智健康”為主題,著眼國家戰略需求,聚焦前沿科技在健康醫療領域的發展與實踐,薈萃全球頂尖學術觀點,促進多方跨界融
近日,北京市科學技術委員會、中關村科技園區管理委員會公示了北京市2023年第2批科技型中小企業名單,谷器數據借助優秀的科技自主創新能力成功入選。此次評價指標圍繞科研人員、研發投入、科技成果等三個維度,成功入選科技型中小企業是對谷器數據專業化發展、自主創新能力、產品技術實力的激勵與肯定??萍夹椭行∑髽I
評審寄語面向車間現場生產制造過程的數字化管理,谷器數據SupplyX·MES通過推動更有效的工廠運行和現場效率,提供從接收生產計劃到制成最終產品全過程的生產活動實現優化的信息,成為新型工業化的標桿力量!近日,由中國科學院《互聯網周刊》、中國社會科學院信息化研究中心等機構聯合主辦的“2023(第八屆)
在如今這個數字化轉型時代,大數據在企業發展的過程中發揮了至關重要的作用,大數據技術以更高效和有效的方式提供最好的服務,同時還可以提高生產力、提高客戶滿意度和更高效的智慧化運營。其中,成都四方偉業軟件股份有限公司(以下簡稱“四方偉業”)以優秀的大數據產品和服務獲得了多項行業榮譽。去年,2022數博會數
把脈中國數據智能化
2023年,幾乎可以被定義為中國互聯網公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內的大模型賽道,曾經的“創業英雄”、如今的商業領袖們親自下場,接連發布生成式人工智能產品與大模型布局。大模型火了,沉寂許久的互聯網行業又有了新的“戰事”。同時,大模型的快速發展也改變了云市場的現狀,企業對
近日,數字化市場研究咨詢機構愛分析發布了《2022愛分析·數據智能廠商全景報告》,愛分析從技術研發能力、服務客戶數量、收入規模等維度對廠商進行了全面專業的評估
2022年11月18日,首個國家級大數據產業創新賽事——2022第一屆中國大數據大賽圓滿落幕。工業和信息化部信息技術發展司數字經濟推進處處長張建倫,中國電子技術標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業和信息化局的指導下,以“數據確權”為主題的2022數據資產(廈門)論壇在廈門成功舉辦。本次論壇以“數據確權”為主題,由廈門市互聯網域名應用服務產業協會和構信網(公信.中國)聯合主辦
近日,國內知名數字化市場研究咨詢機構愛分析正式發布《2022愛分析·信創廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業關注度、行業落地進展等因素,遴選出在信創市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數博會執委會主辦、數據觀(北京)傳媒科技有限公司承辦、貴陽大數據交易所協辦的第四期數博思享會“實踐先行觀公共數據價值與應用”活動成功舉辦。
近日,由中國國際數字經濟博覽會組委會主辦,中國電子技術標準化研究院、河北省工業和信息化廳承辦的“第一屆中國大數據大賽”(簡稱大數據大賽)正式啟動。
廣州光點信息科技有限公司自主研發的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺