(注:近日,數(shù)瀾科技聯(lián)合創(chuàng)始人、輪值CFO高雁冰在天堂硅谷信息技術(shù)閉門會上做了主旨演講,以下根據(jù)其講話內(nèi)容整理而成。)
數(shù)據(jù)中臺今年很火,實際上我們團(tuán)隊在阿里內(nèi)部10年,以及出來創(chuàng)業(yè)3年,一直在做這個領(lǐng)域的事情。過去40年中國其實在IT和信息化這個領(lǐng)域發(fā)展得比較快。但中國過去這么幾十年還沒有發(fā)展出一個千億級的軟件企業(yè)。原因其實很簡單,在過去的40年,中國IT信息化的基礎(chǔ)架構(gòu)是被國外公司壟斷的,國內(nèi)的大部分軟件公司都在做上層的應(yīng)用級開發(fā),干些臟活累活。
今天中國各個行業(yè)的企業(yè)在IT信息化的建設(shè)已具備扎實的基礎(chǔ)和豐富的IT系統(tǒng),累積了大量數(shù)據(jù),但數(shù)據(jù)光是放著,是一個負(fù)債,每年花很多成本維護(hù),怎么把它用起來成為一個難題。這個時候大客戶就提出了:IT時代有像IBM,Oracle這樣的公司可以提供基礎(chǔ)軟件,能支撐我們快速構(gòu)建一些場景化的應(yīng)用。但是今天要用數(shù)據(jù)的時候,全球還沒有這樣的一個技術(shù)架構(gòu)。
這個過程對于傳統(tǒng)企業(yè)是一個很難的事情。第一,企業(yè)的技術(shù)體系非常復(fù)雜,有大量IT公司給他提供異構(gòu)的軟件系統(tǒng),相互間數(shù)據(jù)沒有統(tǒng)一標(biāo)準(zhǔn),最后雜亂無章。對于企業(yè)來講,有什么樣的數(shù)據(jù),數(shù)據(jù)質(zhì)量怎么樣,怎么評估,可用性如何?都沒辦法知道。所以讓其構(gòu)建一個數(shù)據(jù)團(tuán)隊太難。第二,大數(shù)據(jù)處理領(lǐng)域,涉及太多的技術(shù)點,例如多元異構(gòu)數(shù)據(jù)如何有效整合?數(shù)據(jù)安全如何處理?怎么讓數(shù)據(jù)形成自然流動的狀態(tài),為業(yè)務(wù)所用?
在國內(nèi),就涌現(xiàn)了大量公司嘗試去解決這個問題,尤其是在金融保險領(lǐng)域。但是這個產(chǎn)物目前更多的是在垂直領(lǐng)域。舉個例子,比如說在金融領(lǐng)域,為了去放小貸或信用卡,我可能構(gòu)建了一個基于信用卡和小貸的這么一個垂直的大數(shù)據(jù)應(yīng)用,把銀行的一部分?jǐn)?shù)據(jù)聚集起來,形成一個數(shù)據(jù)的倉庫,在上面去構(gòu)建一個應(yīng)用。那么明年我要去做其他業(yè)務(wù),比如說風(fēng)控,那么我又要建一個這樣的體系,對于企業(yè)來講,他就感到更困惑。我原來的數(shù)據(jù)是不離散的,它是孤島,它不一致,今天我構(gòu)建了這么一個大數(shù)據(jù)應(yīng)用,我發(fā)現(xiàn)我的企業(yè)內(nèi)部的數(shù)據(jù)更亂,企業(yè)有沒有辦法去解決這個問題?所以又回到這個點,今天為什么數(shù)據(jù)中臺會火,大家都思考一個問題,我能不能在整個企業(yè)內(nèi)部橫向構(gòu)建一套體系,他把我所有的數(shù)據(jù)全部整合起來,它是實時的,然后把這個數(shù)據(jù)形成一套動態(tài)的數(shù)據(jù)資產(chǎn)體系,我上面要去做業(yè)務(wù)的時候,我隨時可以用這套數(shù)據(jù)生產(chǎn)體系,快速的去完成它的整個的交付,這是我們企業(yè)的一個夢想。所以大家談到的數(shù)據(jù)中臺,我們認(rèn)為他就要去解決幾個問題。
現(xiàn)在說兩個部分,第一部分就是我們團(tuán)隊認(rèn)為什么才叫企業(yè)的一些數(shù)據(jù)中臺?它會去具備什么樣的特點?它可以做什么?它不可以做什么?它怎么去解決企業(yè)存在的問題?所以其實對于數(shù)據(jù)中臺這個詞來講的話,每一個企業(yè)每個人都有自己的理解,那么我們認(rèn)為它其實是一套系統(tǒng),把一個企業(yè)的數(shù)據(jù)持續(xù)的運用起來的一套機(jī)制,它是一套動態(tài)的體系,它不是一個軟件,它不是一個產(chǎn)品。沒有一個產(chǎn)品叫數(shù)據(jù)中臺賣給你,直接買就能用。數(shù)據(jù)中臺它其實是一個工具,加上企業(yè)本身對數(shù)據(jù)的一種理解和認(rèn)知,然后再加上企業(yè)本身特性化的數(shù)據(jù),形成了一套資產(chǎn),共同形成了一套體系。這個體系是屬于中臺,就好像我的客戶,比如說萬科,它的數(shù)據(jù)中臺,我們幫他構(gòu)建的跟碧桂園肯定是不一樣的。像中國地產(chǎn)公司TOP20我們服務(wù)了差不多一半,每一家都不一樣,萬科有11個業(yè)態(tài),碧桂園有12個業(yè)態(tài)。那么像龍湖等其他的公司他又不太一樣,它的數(shù)據(jù)結(jié)構(gòu)和體系都不一樣,所以在整個的企業(yè)數(shù)據(jù)終端這個領(lǐng)域,我們認(rèn)為它其實是一個閉環(huán)的一個系統(tǒng)。對于企業(yè)來講,第一個就是說如何他把他的業(yè)務(wù)數(shù)據(jù)化的過程,就是傳統(tǒng)的IT要干的事,對吧?而且所有的業(yè)務(wù)過程通過ERP這些系統(tǒng)轉(zhuǎn)化成一些數(shù)據(jù)沉淀下來,然后接下來的事就是數(shù)據(jù)中臺要去干的,把這些業(yè)務(wù)數(shù)據(jù)通過一套資產(chǎn)化的一套體系轉(zhuǎn)化成企業(yè)的數(shù)據(jù)資產(chǎn),然后再把這些資產(chǎn)轉(zhuǎn)化成我們業(yè)務(wù)人員看的明白的數(shù)據(jù)的服務(wù),最后這些服務(wù)直接能跟我們的上層的業(yè)務(wù)流程去集成起來。比如說優(yōu)化我們現(xiàn)有的業(yè)務(wù)流程,優(yōu)化它的性能,優(yōu)化它的效率,提升我們的整個運營成本的控制水平等等服務(wù),那么這些服務(wù)再往下走,它又會轉(zhuǎn)化成一些業(yè)務(wù),沉淀出一些數(shù)據(jù),它整個是一個閉環(huán)的過程。
對于一個企業(yè)來講,要構(gòu)建數(shù)據(jù)中臺,我們認(rèn)為它要解決三個方面的能力,第一個就是把你紛繁復(fù)雜的這種數(shù)據(jù)體系,這些系統(tǒng)可能里面有大量的結(jié)構(gòu)化的數(shù)據(jù),還有一些文本語音圖片流媒體的非結(jié)構(gòu)化的數(shù)據(jù),通過一套我們把它叫數(shù)據(jù)自然流動的技術(shù),能夠轉(zhuǎn)化成一套數(shù)據(jù)的資產(chǎn),這是第一個部分的功能。第二個部分,把你的這些初步匯集過來的數(shù)據(jù),經(jīng)過我們進(jìn)一步的數(shù)據(jù)處理的技術(shù),讓你的業(yè)務(wù)人員能夠看得明白。轉(zhuǎn)化成一套可視化的數(shù)據(jù)資產(chǎn)體系。然后第三個部分,把這些數(shù)據(jù)資產(chǎn)體系通過一個動態(tài)服務(wù)的框架,當(dāng)你的業(yè)務(wù)場景發(fā)生變化的時候,能夠隨需而變,馬上就能夠去開發(fā)出來。我舉個例子,比如說像我們在華泰證券,像我們在萬科里做的,他們原來一個業(yè)務(wù)產(chǎn)品發(fā)生變化的時候,他們平均的開發(fā)和交付的周期大概是3到6個月,那么用了我們的數(shù)據(jù)中臺體系之后把他的時間大概就縮短到幾個小時到幾天,其實這樣就能夠徹底的去解決企業(yè)的問題。
今天我們說企業(yè)要做數(shù)字化轉(zhuǎn)型示范,最大的一個問題是什么呢?是因為它的業(yè)務(wù)高速發(fā)展,它的業(yè)務(wù)在前臺快速變化的時候,那么它后端的這種IT支撐的交付能力跟不上。所以當(dāng)IT開發(fā)出來的時候,實際上我們業(yè)務(wù)這個場景早就過去了。如果你能極大的去降低這樣一個速率不匹配的問題,相對企業(yè)的價值來講是非常大的。實際上從整個業(yè)務(wù)的定位來講的話,對于企業(yè)本身的發(fā)展,它是分成幾個階段,第一個就跟我們傳統(tǒng)的IT建設(shè),也會有很多大量的IT系統(tǒng)。然后過去的十年,我們企業(yè)其實也在做各種“互聯(lián)網(wǎng)+”,我們有很多線上的業(yè)務(wù)開展起來,進(jìn)了大量的線上的系統(tǒng)。所以我們進(jìn)入互聯(lián)網(wǎng)的一個時代,那么今天大家在講,數(shù)據(jù)的這個時代,它的特點是什么?數(shù)據(jù)中臺的概念是,他要穿透整個企業(yè)的所有的核心業(yè)務(wù)域,成為整個企業(yè)的一個基礎(chǔ)架構(gòu)核設(shè)施,那么所有企業(yè)的數(shù)據(jù),都要通過數(shù)據(jù)中臺把他的能力釋放出來,不管是傳統(tǒng)的業(yè)務(wù),還是我們的“互聯(lián)網(wǎng)+”的業(yè)務(wù)形態(tài),還是在數(shù)據(jù)時代的一些新興的業(yè)務(wù)平臺,其實都是作為數(shù)據(jù)中臺的一個核心的支撐的一個基礎(chǔ)。
本身從數(shù)據(jù)中臺的建設(shè)上來講的話,那么我們認(rèn)為四點其實是非常關(guān)鍵的,就是數(shù)據(jù)中臺這個東西,它本身是一個企業(yè)的基礎(chǔ)架構(gòu),它是不會帶來直接的業(yè)務(wù)價值。大家可以把它理解為它就是企業(yè)的一個業(yè)務(wù)和數(shù)據(jù)的操作系統(tǒng)。那么這個操作系統(tǒng)能干什么呢?待會我們在下面可以去看到它可以做什么事情,但是我們認(rèn)為有四點是特別重要的。你幫企業(yè)構(gòu)建一個數(shù)據(jù)中臺,首先來講的話,那么在建設(shè)過程中,首先對于企業(yè)來講,比較重要的第一點就是你整個數(shù)據(jù),不管你怎么處理和治理,我要可見。到底數(shù)據(jù)處理成一種資產(chǎn),而資產(chǎn)是怎么表現(xiàn)出來,我要看到。這些數(shù)據(jù)是從什么地方來的?數(shù)據(jù)的血緣是可以被追溯的。對于企業(yè)來講,其實是一個比較頭疼的問題,我給大家舉一個例子,我們跟萬科在合作做物業(yè)地產(chǎn)服務(wù)業(yè)的時候,這么小一個case,萬科有42家分公司,有27家軟件公司給他提供了27套物業(yè)管理系統(tǒng),每一個系統(tǒng)都不一樣,數(shù)據(jù)結(jié)構(gòu)完全沒有標(biāo)準(zhǔn)化,這都是一些什么文本語音的東西。那么針對這類的,你把它全集團(tuán)集中化了之后,實際上在集團(tuán)這個層面看到的就是一套東西,到底我有什么客戶,他們持有什么樣的物業(yè),他們的服務(wù)水平怎么樣?怎么去定義?周邊的合作伙伴怎么去定?那么在整個數(shù)據(jù)處理過程中,這27個系統(tǒng)42家分公司的數(shù)據(jù)處理,它是一個循源源不斷的過程,那么我們要讓整個過程看起來要是可見要是可用的,所以第二點是可用。
第三個就是可懂,對業(yè)務(wù)人員來講,在下面的那些物業(yè),收到的信息就是一些人打電話,很多次報修,但是物業(yè)的人,不知道這代表什么,不知道怎么去更進(jìn)一步的去優(yōu)化對客戶的服務(wù)水平。所以當(dāng)我們把這些數(shù)據(jù)聚焦處理整合打通之后的話,基層業(yè)務(wù)人員能看的明白了,比如說他到底是哪一點不滿意,那么客戶的這種客服人員可以針對它去做相關(guān)的動作。
然后第四個對一個企業(yè)來講,其實是最核心的一點,我們認(rèn)為數(shù)據(jù)既然是一種資產(chǎn),它一定是可運營的,這一點是最難的。很多企業(yè)號稱建了一個數(shù)據(jù)平臺,完了就放在那里,因為他們不知道怎么去持續(xù)運營這些數(shù)據(jù),你不知道怎么去運營這些數(shù)據(jù),那么它對于業(yè)務(wù)的價值就沒辦法完全的發(fā)揮出來,很有限。所以其實在我們跟很多企業(yè)接觸的時候,我們都告訴他,數(shù)據(jù)中臺不是一個產(chǎn)品,不是說你買了就能用的,它是一套體系。那么怎么去幫助企業(yè)去構(gòu)建數(shù)據(jù)中出來,我們認(rèn)為它要分成三個部分,這里其實是我們一個方法論的一個介紹。總體來講分成哪三個部分或者三個階段,第一個叫我們叫方法論導(dǎo)入,因為很多企業(yè)的老板,今天盡管他們都在講數(shù)據(jù)中臺這個東西,但是他不懂,很多老板不懂,跟很多老板交流過,他不知道怎么樣去構(gòu)建這樣一套體系。他的團(tuán)隊有沒有數(shù)據(jù)的理解和認(rèn)知,實際上不確定。然后圍繞著建立一套數(shù)據(jù)的一個自動化的驅(qū)動的一套機(jī)制,他的業(yè)務(wù)部門和它的IT部門應(yīng)該怎么去重塑?怎么去樹立他的這種合作的邊界,他們也不清楚。下一步的數(shù)據(jù)運營該怎么去用,怎么去驅(qū)動起來,他們其實也不了解,所以一般在企業(yè)里去實施數(shù)據(jù)中臺戰(zhàn)略的時候,我們第一步就是幫企業(yè)去做一個簡單的咨詢,我會告訴他幾點。
第一點就是來講數(shù)據(jù)中臺,因為它是個企業(yè)級的應(yīng)用,它一定是一把手工程,不是某一個部門的領(lǐng)導(dǎo)說了這個算了。所以一定是CEO或者CFO親手掛帥的一個項目,它是一個企業(yè)級的戰(zhàn)略。為什么是個企業(yè)級的戰(zhàn)略?它承載了企業(yè)數(shù)字化轉(zhuǎn)型的一個核心,首先在這一點上我們會告訴企業(yè)的一把手怎么去思考和建立這套體系。第二個就是在整個的組織方面,在配套的整個數(shù)據(jù)體系的認(rèn)知上面,我們會跟客戶一起形成一個團(tuán)隊,怎么去讓它具備對數(shù)據(jù)的理解和認(rèn)知的一個觀念,就是說從企業(yè)的角度來講,你剛才講這個需求最后落到實點就是什么?
第一,數(shù)據(jù)的標(biāo)準(zhǔn)怎么去建立起來?比如,在政府的其他的部門,在地產(chǎn),在零售,在金融,教育,工業(yè)這些行業(yè),它的每一個行業(yè)的標(biāo)準(zhǔn)是不一樣的,如何去建立這樣一套數(shù)據(jù)標(biāo)準(zhǔn),客戶是不知道的,因為它的系統(tǒng)太復(fù)雜,所以它其實很難去建立這個標(biāo)準(zhǔn),我們要告訴他建立這套標(biāo)準(zhǔn)的整個模式,配套給他一個工具,如何建立。
第二個,數(shù)據(jù)資產(chǎn)化的體系怎么去設(shè)計,包括它現(xiàn)有的組織怎么去調(diào)整?IT部門內(nèi)部要不要去具備一個數(shù)據(jù)的運營部門或組織要不要建,這里面需要什么樣的一些人員,他們是不清楚的,那我們要告訴他們,數(shù)據(jù)的本身資產(chǎn)化的體系的設(shè)計,比如說標(biāo)簽整個體系的設(shè)計是如何去做的,我們是教客戶這個方法,不是說直接給他一個結(jié)果。
所以在整個的方法論的層面,我們會跟客戶一起去把整個體系構(gòu)建出來,這是第一個階段。構(gòu)建了這套體系之后,其實第二個階段才是幫助客戶做一個系統(tǒng),有一個軟件,我今天賣給你們,去私有化部署了,部署了這個軟件之后,結(jié)合我們之前的一個在整個方法論層面的梳理,那么我們就把你原有的這些IT系統(tǒng)分階段分批次的逐步的灌進(jìn)來,灌進(jìn)來之后這些數(shù)據(jù)自動就同步過來了,自動的進(jìn)了中臺這個軟件里面,最后形成了企業(yè)的一個可見的數(shù)據(jù)資產(chǎn)體系,這是第二個階段。這個時候你的數(shù)據(jù)中臺基本就初步完成。
第三個階段就是說我們要跟客戶一起去看一下這些數(shù)據(jù)怎么去運營,在它的上面如何去構(gòu)建不同的業(yè)務(wù)場景。實際上這個也是我們現(xiàn)在這種團(tuán)隊比較短板的地方,因為我們其實不懂行業(yè),但是我們是這么看的,也是在這么實踐:真正懂客戶的業(yè)務(wù)一定是他自己。我們這種團(tuán)隊或者叫數(shù)據(jù)中臺要干一件什么事情,你把企業(yè)自己看不懂的數(shù)據(jù),通過你的資產(chǎn)化的能力,最后轉(zhuǎn)化成一種界面上它可見的能看的明白的東西,像我們很多客戶看完、看懂之后,他就自然知道我的業(yè)務(wù)上應(yīng)該采取什么動作,他知道產(chǎn)品的動作之后,就在我的平臺上面去做二次開發(fā),然后再去開發(fā)出一些業(yè)務(wù)的應(yīng)用場景,來完成它整個本身業(yè)務(wù)的賦能,這個是我們現(xiàn)在在干的一些事情,我們認(rèn)為數(shù)據(jù)中臺它本身應(yīng)該也是這樣。
在數(shù)據(jù)中臺上面應(yīng)該有兩類人,一類是大的企業(yè),像銀行、證券、保險、地產(chǎn),它其實都有一個非常強(qiáng)的開發(fā)團(tuán)隊,都可以在我們的終端上做二次開發(fā),還有一類就是說在行業(yè)里生根多年的那些小的開發(fā)公司,或者就是專業(yè)化的開發(fā)公司,他們懂開發(fā),懂行業(yè),懂產(chǎn)品,懂客戶,但是他們不具備大數(shù)據(jù)的能力。那么通過我們這套數(shù)據(jù)的中臺體系,它可以在上面二次開發(fā),完成對于行業(yè)的一些產(chǎn)品的深度的一些持續(xù)的開發(fā),這是他們要去做的事情。
在整個的數(shù)據(jù)中臺的構(gòu)建過程中,一定要分階段的話,我們是會把它分成這樣的五個階段。其實剛才大概也提到了,那么第一個階段就是跟客戶一起去看,它現(xiàn)有的業(yè)務(wù)的產(chǎn)品是什么樣的。盡管數(shù)據(jù)中臺它是一個基礎(chǔ)架構(gòu),但是他最終的目的也是為業(yè)務(wù)去服務(wù)的,所以在構(gòu)建這個數(shù)據(jù)中臺體系的時候,包括你在構(gòu)建你的數(shù)據(jù)標(biāo)準(zhǔn)的時候,你是需要去分析客戶的業(yè)務(wù)場景的。他的業(yè)務(wù)是什么形態(tài)?它現(xiàn)在的IT建設(shè)的現(xiàn)狀是什么樣的?他的現(xiàn)有的現(xiàn)在的數(shù)據(jù)的一個現(xiàn)狀是什么樣?哪些數(shù)據(jù)的維度存在缺失和空洞,我們是需要幫他整體梳理。客戶他其實并不太清楚。
第二個階段梳理完了之后,我們要幫它去設(shè)計架構(gòu),你的兩套數(shù)據(jù)標(biāo)準(zhǔn)該怎么去定義?那么你的本身的整個業(yè)務(wù)的大圖,大的視圖在你的業(yè)務(wù)人員的指導(dǎo)下,我們會幫你畫出來,你的數(shù)據(jù)的整個架構(gòu)視圖是什么樣的,就幫你去畫出來。然后你的技術(shù)的演進(jìn)的目標(biāo),這些我們都幫他去設(shè)計。然后第三個就是最重要的一個環(huán)節(jié),其實數(shù)據(jù)中臺里面最核心的一點就是數(shù)據(jù)資產(chǎn)的建立的過程,待會兒我們會提到什么是數(shù)據(jù)資產(chǎn),這個詞我感覺也被行業(yè)講濫掉了,但是到底什么是數(shù)據(jù)資產(chǎn),它到底是解決企業(yè)什么問題?
我們通過幾個其實關(guān)鍵的動作,第一個就是數(shù)據(jù)的打通,待會我可以介紹一下什么叫數(shù)據(jù)打通,怎么去打通數(shù)據(jù),然后如何把通過底層打通的數(shù)據(jù)之后,對數(shù)據(jù)進(jìn)行多維度的重新組織,然后把數(shù)據(jù)呈現(xiàn)出給到他的業(yè)務(wù)人員,然后怎么幫他去設(shè)計數(shù)據(jù)模型的標(biāo)準(zhǔn)。第四個過程解決了數(shù)據(jù)資產(chǎn)的問題,就是說怎么讓它把資產(chǎn)用起來。所以在第四個階段就是我們要提供一套什么樣的機(jī)制,能夠讓他在不懂大數(shù)據(jù),不懂開發(fā)語言的情況下,能夠通過界面的拼裝的方式,能夠把一些業(yè)務(wù)的產(chǎn)品在我們的體系能夠設(shè)計和實現(xiàn)出來。
當(dāng)然還有第五個環(huán)節(jié)就是說當(dāng)他把這些應(yīng)用開發(fā)出來之后,我需要有他動態(tài)的數(shù)據(jù)的評價機(jī)制,能夠去優(yōu)化它的整個鏈路,它是一個動態(tài)的過程,但數(shù)據(jù)中臺在建設(shè)過程中,我們認(rèn)為其實有幾個比較核心的點,這里重點去提,從整個技術(shù)的路標(biāo)來講,或者說從整個本身企業(yè)要關(guān)注的點上來講有三個:一個是本身數(shù)據(jù)的,我們把它叫自然流動的技術(shù)。因為在IT本身的建設(shè),它自然有它的雙螺旋的生命周期,一個企業(yè)的IT他一定會永遠(yuǎn)的堅持下去,不停的更新,因為企業(yè)的業(yè)務(wù)生生不息,所以他的IT的建設(shè)就一定會持續(xù)下去。所以它的IT的這種異構(gòu)很復(fù)雜,永遠(yuǎn)會持續(xù),不是說今天你給他整完了之后,明天就結(jié)束了,不是這樣的,明天他也會到不同的軟件公司去上新的軟件應(yīng)用,那么永遠(yuǎn)會存在它的數(shù)據(jù)的一個持續(xù)性和不準(zhǔn)確性,就是一定持續(xù)的一個問題。所以在這樣一個場景下面,你怎么能保證你的數(shù)據(jù)中臺往那一放了之后,能應(yīng)對企業(yè)未來十年幾十年的發(fā)展和變化。那么這些IT系統(tǒng)在新上了之后,或者原有IT系統(tǒng)在修改之后,他只要接到你的數(shù)據(jù)中臺上就能保證它的數(shù)據(jù)能夠快速的能夠變成一種資產(chǎn),這是一個自動化的過程。
第二個就是數(shù)據(jù)資產(chǎn)化的一套體系,你怎么能保證在這樣一個情況下,它的數(shù)據(jù)的資產(chǎn)化也是一個完整的一個全面的自動化的一個過程。然后第三個就是在未來還能夠支持快速的服務(wù)和響應(yīng)。當(dāng)然對于一個企業(yè)精英來講,我們認(rèn)為工程化的能力和計算機(jī)的服務(wù)能力也是非常重要的。對于用戶來講,它有一個非常好的界面,大部分東西要是可視化操作的。這里我們就重點去提一下關(guān)于數(shù)據(jù)的資產(chǎn)化體系,實際上是這樣的,就是我們認(rèn)為數(shù)據(jù)的資產(chǎn)化它本身是一個動態(tài)、一個體系,你從企業(yè)的一個離散無序的數(shù)據(jù)狀態(tài),你把它通過你的一套技術(shù),能夠把它轉(zhuǎn)化成一個用戶的業(yè)務(wù)人員,能夠看得明白,看得懂的數(shù)據(jù)的這個成像,它是一個綜合的過程。
那么這里面其實從表象上來講,就是說從人直觀的看到的東西來講,他就是兩套數(shù)據(jù)標(biāo)準(zhǔn),一套是我們底層的跟行業(yè)業(yè)務(wù)相關(guān)的數(shù)據(jù)標(biāo)準(zhǔn),通過行業(yè)業(yè)務(wù)的數(shù)據(jù)標(biāo)準(zhǔn),你就可以把企業(yè)原來紛繁復(fù)雜的IT系統(tǒng)的數(shù)據(jù)直接映射過來。那么這個映射過程是怎么去做的?當(dāng)然里面會用到大量的人工智能的技術(shù),不能靠手工。我舉個例子,我們很多客戶的IT系統(tǒng)里對他自己的客戶的叫法可能多達(dá)幾十上百種。那么在整個數(shù)據(jù)的處理過程中,你要把它做到自動化,所以這里面需要用到大量的人工智能技術(shù)。第二個就是說標(biāo)簽的內(nèi)部體系的設(shè)計,那業(yè)務(wù)人員能看到一個東西,所以我們怎么去設(shè)計這個東西?這里面有三個的數(shù)據(jù)的核心,我們認(rèn)為實際上很多企業(yè)在做數(shù)據(jù)的中臺建設(shè)的時候,最核心的一個點,我覺得大家沒有可能就是對于數(shù)據(jù)我們是這么來看的,首先企業(yè)在數(shù)據(jù)的整個中臺體系的數(shù)據(jù)設(shè)計,它是要跟業(yè)務(wù)做深度結(jié)耦的,這是第一點。
我們很多傳統(tǒng)的數(shù)倉,其實我們建數(shù)據(jù)模型的時候都是按照組數(shù)據(jù)的方式來解決,這是不對的,因為企業(yè)的業(yè)務(wù)生生不息,不停在發(fā)展,此消彼長,所以你的核心數(shù)據(jù)模型如果跟他的業(yè)務(wù)綁定的話,其實是最大的一個問題。當(dāng)你的業(yè)務(wù)發(fā)生變化的時候,你的核心模型就會發(fā)生變化,你核心模型承載著上層的所有算法都會出問題。所以在數(shù)據(jù)上匯集過來的時候,第一步要干的事情就是把數(shù)據(jù)跟業(yè)務(wù)結(jié)合,要對數(shù)據(jù)進(jìn)行重新的整合,重新的組織,就不要按照業(yè)務(wù)的維度來組織數(shù)據(jù),這個是很有意思的。這個我們把它叫對數(shù)據(jù)的一種認(rèn)知,第二個就是數(shù)據(jù)的全面打通,打通它是一個比較有意思的概念。像剛才陳總講的,其實很多具備強(qiáng)ID屬性的數(shù)據(jù),我們是比較容易打通的,但是對于企業(yè)來講,很多數(shù)據(jù)它是屬于弱ID的或者沒有ID的。比如說我通過你的網(wǎng)站上面瀏覽一下,沒有登錄,你并不知道我是誰,對不對?我有你的APP的應(yīng)用,用到LBS到處去走一圈,也不知道我是誰。這樣大量的數(shù)據(jù),如果你不把它識別出來,掛到相應(yīng)的數(shù)據(jù)下面的話,這些數(shù)據(jù)其實基本沒有價值。
像我們做的很多金融公司和尤其是互聯(lián)網(wǎng)公司,他們有大概70%的數(shù)據(jù)屬于這一類型,弱ID或者沒有ID,你怎么去把它打通,然后把這些數(shù)據(jù)重新識別出來。這一步非常關(guān)鍵,如果這個問題不解決,其實就會面臨一個問題,舉一個最近的場景,我們對客戶做洞察。你的傳統(tǒng)的數(shù)據(jù)百分之百過來,到你這個洞察做標(biāo)簽定位的時候,發(fā)現(xiàn)只有10%是可用的,為什么?因為你要洞察你要輸入,比如說就是一個用戶的設(shè)備ID,一個用戶的身份證號碼,你會發(fā)現(xiàn)你只能把一些強(qiáng)ID的數(shù)據(jù)抓出來,弱ID的數(shù)據(jù)全丟掉了,所以在構(gòu)建打擊這個體系的時候,那么我們要做一套機(jī)制,在我們內(nèi)部叫多渠道的數(shù)據(jù)ID-Mapping體系,它是專門解決這個問題的,當(dāng)然這個體系以前我們在阿里的時候已經(jīng)構(gòu)建了,所以阿里巴巴的現(xiàn)在他們能夠在1個人的26個緯度,把你所有的數(shù)據(jù)都給打通掉。你只要登錄阿里的任何一個服務(wù),你不需要訂購的,它都會識別數(shù)據(jù)的,準(zhǔn)確率能做到98%。所以它背后的邏輯就是這樣的。
然后數(shù)據(jù)資產(chǎn)上面已經(jīng)解釋了,其實在數(shù)據(jù)最后變成資產(chǎn)了,要去做業(yè)務(wù)賦能的時候,這個過程如何做到動態(tài)化,我們是這么來思考和設(shè)計的。因為你的業(yè)務(wù)場景的變化,往往你可以用相應(yīng)的一個數(shù)據(jù)模型去描述它,然后這個模型最終也可以用算法把它在系統(tǒng)里呈現(xiàn)出來。你的業(yè)務(wù)場景經(jīng)常發(fā)生變化,那就意味著實際上你的算法會經(jīng)常變化,那么我們實際上剛才說的這兩層數(shù)據(jù)的標(biāo)簽內(nèi)容和數(shù)據(jù)內(nèi)部之間,我們是用算法去承載的,就是說數(shù)據(jù)內(nèi)部經(jīng)過一些算法計算,它就會形成標(biāo)簽,那么這個算法是根據(jù)你的業(yè)務(wù)場景走的,當(dāng)你的業(yè)務(wù)場景發(fā)生變化的時候,你就可以在一個可視化界面上去更新你的算法,那么這樣就可以比較完美的去解決第一,快速推出服務(wù)的能力。第二,對整個價格體系的一個柔性的支持和影響。那么這是數(shù)據(jù)資產(chǎn)這套體系在系統(tǒng)的一個呈現(xiàn),這里不多介紹,它其實是分成四個層面。
對企業(yè)來講,ODS是你的所有的原始的數(shù)據(jù)這個層次。第二層就是我們叫中間數(shù)據(jù)層,這一層會按照業(yè)務(wù)的角度去構(gòu)建你整個的數(shù)據(jù)體系標(biāo)準(zhǔn),然后第三層在標(biāo)簽這一層,就是你會看到它跟你跟業(yè)務(wù)是沒有關(guān)系的。而第四個部分就是說通過標(biāo)簽,然后往上形成數(shù)據(jù)的一些服務(wù)。那么這些服務(wù)在往上就是ADM里給到業(yè)務(wù)去使用。這是我對于數(shù)據(jù)中臺的一些思考。
那么其實在我們目前來講,經(jīng)過三年也服務(wù)了全國大概300多家各個行業(yè)大型的一些客戶,那么這是我們在做工業(yè)智能制造這個領(lǐng)域的。當(dāng)然有部分客戶我們是不便于披露的,它有比較高的保密要求。實際上在智能制造這個領(lǐng)域,我們主要做幾件事情,一個就是用一些互聯(lián)網(wǎng)采集的一些數(shù)據(jù),幫助一些制造型企業(yè)干幾個事情。
第一個就是像剛才其中提到的,我們?nèi)绾稳ソ档驼麄€的設(shè)備本身運行過程中的一些故障的問題,經(jīng)過故障的一些預(yù)測。第二個在整個全面的生產(chǎn),比如說一個工藝流程有幾百個環(huán)節(jié),那么我們怎么去優(yōu)化它,找出它的環(huán)節(jié)瓶頸,去優(yōu)化它。然后第三個就是說在一些制造的一些良品率上面,我們怎么通過數(shù)據(jù)的一個相關(guān)性的一種識別和挖掘,幫助他去提升最終成品的了解。第四個是在整個智能制造的過程中,我們給他提供一個全面的制造駕駛艙,把它所有的數(shù)據(jù)和動態(tài)的展示和歸集起來,這是我們在國內(nèi)的一些嘗試。
第二個就是國內(nèi)最大的一個媒體公司,他們其實有大量的數(shù)據(jù),以前他們在做媒體做這種最新的一些時尚的設(shè)計的時候,其實都是找特別牛逼的團(tuán)隊,那么現(xiàn)在我們幫他構(gòu)建一套體系,把它過去媒體的所有的這些非結(jié)構(gòu)化的信息數(shù)據(jù)全部整合起來,然后結(jié)合他現(xiàn)有的一些IT系統(tǒng)的數(shù)據(jù),就現(xiàn)在能做到什么?通過我們這套平臺,它現(xiàn)在一些普通的設(shè)計師也可以比較好的抓住媒體時尚的一些熱點,然后去做一些特別好的一些產(chǎn)品設(shè)計,降低整個產(chǎn)品,整個全生命周期設(shè)計的成本。
這是國內(nèi)的一個地產(chǎn)案例,其實這講的就是萬科的,當(dāng)然我們在國內(nèi)還做了像龍湖雪松、碧桂園等,所以他們來講最大的一個問題就是說數(shù)據(jù)太復(fù)雜,多業(yè)態(tài)沒辦法協(xié)同,所以他們今天為什么要去構(gòu)建這樣一個數(shù)據(jù)中臺,就是先把他所有業(yè)態(tài)的數(shù)據(jù)放進(jìn)來,放進(jìn)來之后,按照它的產(chǎn)業(yè)地產(chǎn),住宅地產(chǎn),商業(yè)地產(chǎn)的幾個維度,把數(shù)據(jù)重新標(biāo)準(zhǔn)化,再去對它整個業(yè)務(wù)體系進(jìn)行重塑,像萬科就是這個過程。目前,我們的規(guī)劃是三年,三年之內(nèi),要把它全國的11個業(yè)態(tài)所有的東西全部放在這個平臺上來,所有它未來的新業(yè)務(wù)都會在基于這個平臺進(jìn)行二次開發(fā),那么整個萬科集團(tuán)的2000多個開發(fā)人員,都會在我們平臺來完成整個集團(tuán)的相關(guān)開發(fā)性工作。
在政府里面的一個簡單的應(yīng)用,現(xiàn)在尤其是在數(shù)據(jù)處理的每個環(huán)節(jié),因為會用到大量的人工智能的技術(shù),所以類似在公安檢察院安全口的公檢法司,實際上在大數(shù)據(jù)的落地能力是非常強(qiáng)的。那么我們這是在整個浙江省做的各級檢察院,那么主要幫助解決什么問題?通過數(shù)據(jù)處理的核心軟件和AI的能力,能夠幫他把現(xiàn)有的一些檢察院他們要去做的判案,我們幫他們做一個輔助的判案一套體系,那么極大地提升它的效率,幫助他提高90%多的效率,而且基本上沒有錯誤率。
現(xiàn)在,我大概介紹一下數(shù)瀾科技這家公司,我們這家公司成立于2016年,實際上三年多以來我們一直專注在大數(shù)據(jù)的基礎(chǔ)架構(gòu)里,我們團(tuán)隊其實前身是由兩個團(tuán)隊構(gòu)成,一個是阿里最早的一批做大數(shù)據(jù)的團(tuán)隊,大家可以看到的就是阿里的大數(shù)據(jù),整個體系我們從2008年開始一直做到2016年,基本上是把它完全的做出來。第二塊就是來自于華為的2012實驗室的一些同學(xué),那么當(dāng)然還有全球的一些像Stanford和MIT的一些同學(xué),那么我們一直在專注于做企業(yè)本身數(shù)據(jù)的基礎(chǔ)架構(gòu)這個領(lǐng)域,我們認(rèn)為實際上在今天全球進(jìn)入數(shù)據(jù)時代來講的話,中國是有可能在基礎(chǔ)架構(gòu)領(lǐng)域能夠領(lǐng)先于全球的,但互聯(lián)網(wǎng)我們其實已經(jīng)領(lǐng)先了半個身位了。我們在中國的復(fù)雜的應(yīng)用場景的驅(qū)動下,今天我們是有可能領(lǐng)先于全球去做這樣一個基礎(chǔ)架構(gòu)的事物。
所以在三年多的時間里,我們服務(wù)了全國各個行業(yè),現(xiàn)在是七大行業(yè),超過300多家,我們也是針對頭部客戶。有幾個數(shù)據(jù),第一個就是說我們現(xiàn)在大概的客單價大概300多萬費用,針對頭部客戶。第二個就是說我們基本上所有的客戶,我們現(xiàn)在能做到百分之百的復(fù)購,因為在對企業(yè)做數(shù)字化轉(zhuǎn)型來講的話,實際上它一旦要選擇這個方向,它其實一定會堅定不移走下去的。在數(shù)瀾科技成立三年來講,我們也得到了像天堂硅谷這樣的一些頂級投資機(jī)構(gòu),還有IDG和云鋒這些機(jī)構(gòu)的一個比較大的支持,我們目前也經(jīng)過了四輪的融資,在做第五輪,也拿到了一些資金的支持,當(dāng)然也拿到了我們投資者對我們?nèi)轿坏钠渌闹С帧?/p>
數(shù)瀾其實有一個最簡單的企業(yè)的使命,我們希望幫助企業(yè)把數(shù)據(jù)給用起來。我們希望通過我們的技術(shù)和服務(wù)的能力,真正地幫助各行各業(yè)的客戶把他自己的數(shù)據(jù)用起來,用好,這就是我們一直會保持不變的使命和價值愿景。
謝謝大家。