近日,中國乃至全球的第一份《數據競賽白皮書》(以下簡稱“白皮書”)發布,首次為我們從全局的角度盤點了數據競賽的發展歷程、現狀以及價值。白皮書指導單位為“大數據系統軟件國家工程實驗室”,和鯨科技攜旗下第三方數據競賽平臺和鯨社區(Kesci),聯合AWS共同發布。
據發布方的信息顯示,白皮書通過搜集整理1000場全球競賽數據、1000余份問卷調研、幾十位行業專家及企業辦賽負責人的訪談、超過1200小時的分析研究,共同打造并發布了《數據競賽白皮書》(以下簡稱“白皮書”)。白皮書分為《數據競賽白皮書·上篇·1000場競賽的深度分析》和《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》兩部分。
《數據競賽白皮書·上篇·1000場競賽的深度分析》中指出,數據競賽的發展起點可追溯至 1997 年首次問世的 KDD Cup,由國際頂會KDD 牽頭舉辦,這也是數據科學領域迄今為止最重要的國際賽事之一,至今已經舉辦22年。
今天,就讓我們跟著白皮書一起,回顧一下這二十多年數據競賽與國際頂會的歷程吧。
2019年夏天有件令人驚喜的事件傳遍了全國——KDD CUP 2019三個賽道的冠軍全都被華人面孔拿下。被譽為數據挖掘領域「奧運會」的 KDD CUP,從1997年到現在已經舉辦了22屆,是目前數據挖掘領域最有影響力的賽事。也是從今年開始開始, KDD CUP 擁有了專屬的獨立議程,供世界數據挖掘界的頂尖專家、學者、工程師、學生等前來參賽,在KDD中的分量越來越重要。
K D D(Conference on KnowledgeDiscovery and Data Mining,知識發現和數據挖掘會議)隸屬于 ACM(Association forComputing Machinery,國際計算機學會),是響譽全球的頂級學術會議。1997 年, KDD 正式推出 KDD Cup,KDD Cup 要求參賽者通過數據分析,判斷出哪些人有可能成為美國癱瘓退伍軍人協會的捐贈者,從而幫助協會更精準地發送求助郵件,開啟了數據競賽的新模式。此后,KDD Cup 保持了一年一度的舉辦慣例。
1999 年KDD Cup 的賽題更為經典,選用了來自美國國防部高級規劃署在 MIT 林肯實驗室操作進行的入侵檢測評估項目數據,希望參賽者能夠分辨那些操作是外部入侵,獲勝者是廣為人知的統計分析軟件公司 SAS。作為數據挖掘領域影響力最廣、水平最高的國際頂級賽事,KDD Cup 20 余年以來的賽題設計始終帶有鮮明的工業應用色彩,每年都會吸引大量優秀的企業、高?;蚩蒲袡C構協辦賽事,或直接參給與競賽角逐。
通過KDD Cup 的歷年成果上不難看出,雖然面臨的問題日益復雜,但始終帶有強烈的工業應用色彩,高度契合各類組織機構的實際需求,不斷涌現出全新的應用場景。KDD Cup的成功,帶動了ICCV、NeurlPS、ISBI、Euro CSS、ECML-PKDD、VoxCeleb、MICCAI、C-MIMI、IEEE-CIS、CVPR(ActivityNet)、IWCS、ECCV 等國際頂尖學術會議紛紛加入這一浪潮。
他們除了在世界不同地域舉行年度性盛會外,也開始聯手全球各地的企業、科研機構共同籌辦數據競賽,以短時間競賽的形式幫助前沿數據科學技術的進一步發展。這類享有頂會權威背書和國際影響力的重大賽事在全球范圍內得到了積極響應,參賽對象不僅限于技術水平突出的個人,還囊括了科研實驗室、高校和企業等一系列組織。
國際頂會數據競賽也往往會積極兼顧市場應用的需求,通過與企業、政府機構合作,聚集當下技術與數據應用中的難點尋求解決思路, 不斷縮短科研成果與落地應用之間的距離,賽題內容廣泛覆蓋醫療、軍事、互聯網、交通出行、快消零售、生態及文化保護等眾多場景。
中國企業、高校及科研機構和個人參賽者在國際頂會數據競賽的獲獎次數呈現逐年上升的趨勢,亦反應了中國在數據科學領域的實力和影響力不斷加強。在中國也有一些企業開始和國際頂會合作,舉辦基于行業應用的數據競賽。而數據競賽的進程也伴隨著人工智能相關科技專利的爆發期,從2000年開始不斷向上。
根據麥肯錫全球研究院發布的 MGI 行業數字化指數報告,在產業數字化動態發展的過程中,完備的數字資產積累、充分的資本投入與研發、可持續的人才連接與協同推進了產業數字化程度的不斷加深,進而帶來了較高的平均利潤增長率以及勞動增長率。
《數據競賽白皮書》中提到,通過數據競賽形式并以此建立基于數據價值流動的生態系統,才能充分利用生態內不斷升級的人才資源和技術資源賦能商業發展,已成為越來越多商業領袖的共識。相較于傳統的數字化進程,主動采用數字化戰略的企業明顯能在后續發展中與競爭對手拉開差距。
中國數據競賽的崛起并非偶然,也不止是對國外先進模式的亦步亦趨,而是在技術落地應用需求增長、宏觀政策支持和云計算基礎不斷成熟等原因之下的必然結果。建立基于數據價值流動的生態系統,充分利用生態內不斷升級的人才資源和技術資源賦能商業發展,已成為越來越多商業領袖的共識。
據悉,在《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》中,和鯨科技將首次公開自身100+場專業賽事的服務經驗,開源其數據競賽管理的方法論,這將對數據競賽行業產生不小的沖擊。和鯨科技是中國對標Kaggle成立的,最早的數據競賽平臺之一,且在這個過程中形成了在用戶數、用戶質量、活躍度方面均有出色表現的中國數據科學家社區——和鯨社區(由Kesci發展而來)。在和鯨社區上,有來自中國聯通、中國平安、招商銀行、騰訊、百度、字節跳動、攜程、IBM、華為、默克中國、南京市人民政府、深圳市人民政府、鵬城實驗室等頭部企業與機構舉辦數據競賽。通過開放競賽的機制和數據科學的手段,解決各個行業的業務難題。
國內最高規格的大數據競賽,由教育部主辦的“中國高校計算機大賽-大數據挑戰賽”,以及獎金規模最大的人工智能大賽,由深圳市政府主辦的“全國人工智能大賽”,都選擇在和鯨社區完成全流程的組織。由此可見,《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》必然會促進“數據競賽”這一高效、敏捷的數字化創新模式,在中國進一步發展。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
隨著數字中國戰略的步步落實,大數據已經成為錨定戰略定位、搶得市場先機的重要基礎元素。為彰顯行業發展現狀,遴選、推薦優秀企業,長城戰略咨詢近日在2023中國國際大數據產業博覽會期間,重磅發布《中國大數據獨角獸企業榜單》,根據獨角獸企業國家推薦性標準,篩選出259家2022年中國大數據(潛在)獨角獸企業
2023年6月15日至18日,2023北京健康醫療大數據論壇、醫促會華夏健康數據與數字醫學高峰論壇、第三屆中華預防醫學會腎臟病預防與控制專業委員會學術會議將同期于北京舉行。論壇以“學術引領數智健康”為主題,著眼國家戰略需求,聚焦前沿科技在健康醫療領域的發展與實踐,薈萃全球頂尖學術觀點,促進多方跨界融
近日,北京市科學技術委員會、中關村科技園區管理委員會公示了北京市2023年第2批科技型中小企業名單,谷器數據借助優秀的科技自主創新能力成功入選。此次評價指標圍繞科研人員、研發投入、科技成果等三個維度,成功入選科技型中小企業是對谷器數據專業化發展、自主創新能力、產品技術實力的激勵與肯定??萍夹椭行∑髽I
評審寄語面向車間現場生產制造過程的數字化管理,谷器數據SupplyX·MES通過推動更有效的工廠運行和現場效率,提供從接收生產計劃到制成最終產品全過程的生產活動實現優化的信息,成為新型工業化的標桿力量!近日,由中國科學院《互聯網周刊》、中國社會科學院信息化研究中心等機構聯合主辦的“2023(第八屆)
在如今這個數字化轉型時代,大數據在企業發展的過程中發揮了至關重要的作用,大數據技術以更高效和有效的方式提供最好的服務,同時還可以提高生產力、提高客戶滿意度和更高效的智慧化運營。其中,成都四方偉業軟件股份有限公司(以下簡稱“四方偉業”)以優秀的大數據產品和服務獲得了多項行業榮譽。去年,2022數博會數
把脈中國數據智能化
2023年,幾乎可以被定義為中國互聯網公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內的大模型賽道,曾經的“創業英雄”、如今的商業領袖們親自下場,接連發布生成式人工智能產品與大模型布局。大模型火了,沉寂許久的互聯網行業又有了新的“戰事”。同時,大模型的快速發展也改變了云市場的現狀,企業對
近日,數字化市場研究咨詢機構愛分析發布了《2022愛分析·數據智能廠商全景報告》,愛分析從技術研發能力、服務客戶數量、收入規模等維度對廠商進行了全面專業的評估
2022年11月18日,首個國家級大數據產業創新賽事——2022第一屆中國大數據大賽圓滿落幕。工業和信息化部信息技術發展司數字經濟推進處處長張建倫,中國電子技術標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業和信息化局的指導下,以“數據確權”為主題的2022數據資產(廈門)論壇在廈門成功舉辦。本次論壇以“數據確權”為主題,由廈門市互聯網域名應用服務產業協會和構信網(公信.中國)聯合主辦
近日,國內知名數字化市場研究咨詢機構愛分析正式發布《2022愛分析·信創廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業關注度、行業落地進展等因素,遴選出在信創市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數博會執委會主辦、數據觀(北京)傳媒科技有限公司承辦、貴陽大數據交易所協辦的第四期數博思享會“實踐先行觀公共數據價值與應用”活動成功舉辦。
近日,由中國國際數字經濟博覽會組委會主辦,中國電子技術標準化研究院、河北省工業和信息化廳承辦的“第一屆中國大數據大賽”(簡稱大數據大賽)正式啟動。
廣州光點信息科技有限公司自主研發的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺