它是大數據新三板第一股,見證著大數據落地中國的6年 從萌芽期到寒冬

瀏覽:135 作者: 來源: 時間:2020-06-13 分類:
齊紅威認為,人工智能比電商、搜索引擎、大數據這幾波的商業空間都要大,因為它是無孔不入的,能夠進入到任何一個領域和行業進行產業升級和結構化調整,這么大的商業空間,而人工智能才剛剛開始。

說到數據,大家并不陌生,從分類方式上,可以分為結構化數據(企業ERP、財務系統等)和非結構化數據(視頻、語音數據為主)。按數據占比情況劃分,非結構化數據占比80%,而結構化數據僅占20%,過去的數據分析主要是基于結構化數據做應用和優化,但是80%的非結構化數據被閑置,基于人工智能技術的蓬勃發展,非結構化數據的價值挖掘開始成為熱點,數據堂的發展背景大抵如此。

數據堂主要業務是提供數據采集、制作、共享和增值服務的數據資源運營商。上游對接數據擁有者,下游對接數據使用者。數據堂并不是從事具體的行業應用開發,因此在C端的認知度并不高,但是對于B端數據應用類型的企業而言,是非常熟悉的。提供類似服務的公司還包括海天瑞聲和標貝科技,這三家公司的業務類型各有差異。

成立于2011年的數據堂,齊紅威認為自己見證了中國大數據行業的誕生與發展,2011年從業者開始炒作大數據概念,2012-2013年找業務方向。2014年創立公司,2015-2016年出規模,大數據中國落地的前6年大概如此。

然而先到者有福利,齊紅威在融資路上一直走得比較順,創業初期自有資金探索模式,2014年初,數據堂拿到田溯寧云基地和國泰創投1300萬元的pre-a輪融資,2014年底掛牌新三板,成為大數據行業第一股,2015年5月完成由達晨創投領投的A輪融資4200萬元,最近的一輪融資是2016年獲得2.4億元人民幣B輪融資,由中航信托、海通證券、東方證券、浙商資管、青島華通、安徽國富共同出資。

人工智能對數據有強依賴性,數據堂強勢布局

數據堂的模式好比石油領域的中石油和中石化。三段論:第一階段獲取原油,第二階段將原油做深度的加工,提煉成品標準油產品,第三階段面向加油站或者特殊行業提供標準油產品。數據領域同比也差不多,第一階段給有數據的單位做深度合作,獲取數據的使用權,第二階段,將數據分析、處理、融合,做成標準的數據產品,第三階段,將標準的數據產品賣給具體的行業應用企業。

數據堂營收分數據租賃和數據交易兩種模式,對于中小型客戶,他們希望低成本地訓練算法模型,數據集對于模型訓練只需要用一次,數據集本身價格貴,因此可以租賃使用的模式??蛻魧⑺惴P筒渴鹪跀祿玫姆掌魃?,數據堂提供數據集給予模型做單次訓練,訓練結束之后,客戶帶走模型,留下數據集,這相當于客戶租賃了數據集的單次服務。另一種模式,對于大企業而言,他們有充足的資金,愿意購買數據集,那就直接售賣數據集。

同理,政府、電信運營商等單位數據,客戶發出需求,數據堂將算法模型部署在數據提供商服務器中,最后只能取走算法模型,數據不能帶出門,另一個考慮,數據量很大,儲存成本不小,所以齊紅威更愿意將模型部署到數據提供商的服務器中。“這是行業目前最有默契的合作模式,各取所得”,齊紅威暗示。

數據堂最大的收入來自于人工智能行業,最大的客戶也來自于人工智能行業,齊紅威認為,現在人工智能行業對數據的需求遠沒到飽和的狀態,以人臉識別公司為例,人工智能在每個百分點精度提高都離不開海量的數據集訓練,而且很多人工智能企業有海外拓張的需求,而國內的人臉數據集就不能滿足海外算法產品模型的需求,需要根據當地的人臉數據集重新對模型進行訓練,因此,人工智能對數據的依賴是很大的。

齊紅威認為,人工智能比電商、搜索發動機、大數據這幾波的商業空間都要大,因為它是無孔不入的,能夠進入到任何一個領域和行業進行產業升級和結構化調整,這么大的商業空間,而人工智能才剛剛開始。

齊紅威的戰略是“廣積糧、筑高墻、緩稱王”

區別于海天瑞聲簡單的數據服務(采集、清洗、標注),數據堂特征是做行業化細分數據產品,以無人駕駛為例,無人駕駛行業需要的數據是多樣的,包括路況數據、地圖數據、指示牌數據、紅綠燈數據等,數據堂能根據行業特征,系統性、多維度地收集數據,滿足行業化需求。

數據堂通過行業型的數據產品方案,讓數據能夠定制化的貫穿一個領域,當領域做透之后,這個數據就具備重復使用、規?;哪芰?,齊紅威認為“向前多走了一步”,只有行業化的數據產品才能產生更大的附加價值,才能提升營收規模和利潤率。但同時意味著需要多維度的數據、龐大的存儲基礎、豐厚的流動資金,做數據產品的特征明顯,前期投入大,后期投入少,營收規模則相反,前期營收少,后期營收多的交叉型商業模型。

這種商業模式的創業風口,齊紅威認為“已經沒新機會了”,也正是由于數據堂做得比較早(成立于2011年),并且成為新三板大數據交易與服務產品第一股,才有機會在屢次資本寒冬中持續融資,三次融資下來,積累發展資本將近3億元。

齊紅威很喜歡上述的gartner曲線,并且對大數據行業進行代入分析,他總結:2011年是萌芽期,歷經2012、2013、2014年的爬坡發展,到2016年進入行業狂熱期,在2017年進入到下滑通道,將有大量的、產生不出實際價值的企業死掉,誰能熬過幻想破滅期,誰才能真正的活下來。在2017年的時間節點,齊紅威的戰略是“廣積糧、筑高墻、緩稱王”。

應用人工智能技術,數據標注和加工從勞動密集型到技術導向型

自2011年成立至今,數據堂通過自行采集和購買的形式,已經積累自有數據規模超過2000TB,而其中人工智能的數據占據大半。在數據堂庫存中的數據是結果型的優質數據(被訓練好的算法模型或者已經做好標注的數據集),而不是原始數據。

齊紅威將數據堂定位是科技型公司,希望將公司輕盈化,很多勞動密集型的工作,他都以眾包的形式對外輸出,數據堂聚集了50萬有線下數據采集能力的兼職人員,他簡稱為“眾客”,這50萬的眾客身份各異,有學生、家庭主婦、專業發音人等,數據堂通過一個APP實現派單和項目跟進管理事項,讓任務通過眾包的形式得以完成。

現實生活中的80%數據是非結構化數據(圖片、視頻、語音),這種數據在使用之前,必須從非結構化數據變成結構化數據,而個中技術就是人工智能的技術。數據清洗、標注、加工等原本是勞動密集型工作,在數據堂將成為一個技術導向型的工作。

以數據標注為例,數據堂做數據標注是半自動化的流程,假設有100萬張人臉圖片需要打標注點,首先以人工形式標注10萬張,然后用10萬張圖片去訓練一個打標注點機器人,讓這個機器人擁有標注的能力,最后讓眾客基于機器標注的圖片再進一步檢查即可,整個過程減少了大量的人工標注的工作,解放了大量的勞動力。

數據堂的資本布局

在2016年,數據堂在貴陽設立了子公司,在此之前已經在中美兩地建有4家全資子公司,并在北京、南京等地設有5個專業數據處理中心。而這次在貴陽設立子公司,主要是看到政府逐漸在開放數據資源,因此希望在貴陽提前布局。

在資本布局上,2016年數據堂和將門創投共同發起設立大數據產業戰略投資基金,數據堂作為LP出資3000萬人民幣,將對大數據產業鏈上下游相關業務公司進行戰略投資,齊紅威想構建一個健康的大數據生態,在2016年投資食藥網就是很好的開局。

在采訪的最后,齊紅威總結像數據堂這種數據資源提供商,對數據的提煉程度、對數據的挖掘能力是企業核心競爭力,隨著客戶的行業化越來越深入,對數據要求越來越高,很考驗數據資源提供商的數據處理分析能力,因此,數據堂是一個技術導向型的產品公司。


活動推薦:“5G物聯峰會”

作為信息社會通用基礎設施,時下5G產業建設以及發展如火如荼,并將最終帶動數十萬億規模的社會經濟發展。但5G在正式進行商用化普及應用前的態勢如何發展?5G將為哪些領域的變革帶來有益賦能?5G將在各行各業掀起什么樣的市場風暴?系列問題依然困擾著各界人士。

為進一步深入了解產業發展脈絡,理解5G產業現狀以及未來趨勢,讓各界人士更清晰的洞察5G產業發展過程中的機遇點。6月14日,經上海市經濟和信息化委員會、上海市商務委員會、上海市長寧區人民政府指導,由億歐公司聯合承辦的“5G物聯峰會”將于上海虹橋世貿展館舉辦。

億歐“5G物聯峰會”將特邀政府、學界、商業、投資機構等領域的專業人士,以多領域視角切入,深究5G產業發展脈絡,探索5G賦能各行各業的新思路、新方法,供行業內外各界人士參考?;顒釉斍檎埓粒篽ttps://www.iyiou.com/post/ad/id/824

泰瑞信达