<dd id="30gcm"></dd>
        <dd id="30gcm"></dd>
      1. <tbody id="30gcm"><track id="30gcm"></track></tbody>

        <span id="30gcm"></span>

        <dd id="30gcm"><pre id="30gcm"></pre></dd><rp id="30gcm"><object id="30gcm"><input id="30gcm"></input></object></rp>
        <tbody id="30gcm"></tbody>

        <th id="30gcm"></th>
      2. <rp id="30gcm"><ruby id="30gcm"></ruby></rp>
        <button id="30gcm"><object id="30gcm"><input id="30gcm"></input></object></button>
        新聞中心
        您現在的位置: 首頁 > 創新服務> 產品推薦 > 【會員動態】《非結構化數據管理與企業數字化轉型》圓桌論壇:從意識喚醒到標準建設釋放非結構化數據能量詳細內容

        【會員動態】《非結構化數據管理與企業數字化轉型》圓桌論壇:從意識喚醒到標準建設釋放非結構化數據能量

         非結構化數據應用研討會近日在“2021全國大數據標準化工作會議暨全國信標委大數據標準工作組第八次全會”上舉行。會議詳細解讀了國內首個非結構化數據團體標準——《非結構化數據應用能力分級要求》,《分級要求》是國內非結構化數據標準建設工作邁出的重要一步。

        會議上,中國電子技術標準化研究院信息化研究室主任陳亞軍、中國人民大學信息資源管理學院師資博士后楊建梁、鴻翼CTO羅永秀、齊魯藥業集團流程與信息化部董總監、國核電力設計研究院主任工程師張洪偉進行了主題為《非結構化數據管理與企業數字化轉型》的圓桌論壇,就“非結構化數據內涵?”,“非結構化數據管理怎么用”,“非結構化數據管理如何標準化?”等問題展開了深入的討論,產生了很多犀利的觀點。

        陳亞軍:非結構化數據產生于人的活動且服務于人,圍繞著人類轉,但卻能幫助避免因人的個體差異而產生的不一致性。

        楊建梁:非結構化數據是人類社會的一個直觀的表示、直觀的流程,反映在機構中它也是一個機構、一個團體記憶的過程。

        羅永秀:非結構化數據讓人又愛又恨。它具有內容的完整性,極其穩定,蘊含著巨大的能量,但同時又因為顆粒度太大、認知度低,缺乏整體性,讓它的管理難度非常之大。

        張洪偉:計算機是我們處理數據的一種手段,最終還是要回到由非結構化數據構成的這個現實的世界,這種方式能讓我們工作效率更高、更輕松。

        董總監:非結構化數據是連接這個世界的最有效的、表達的最好的一種手段。數字化轉型對企業而言不是一個要不要去實現的一個目標,而是衡量一個企業具不具備持續發展的一種能力。

        alt

        以下為論壇分享內容:

        非結構化數據的內涵和外延是什么?

        羅永秀認為可以把非結構化數據就理解成廣義的電子文件,共包含了文檔類、圖片類,音視頻類,設計類四類文件。

        羅永秀用“讓人又愛又恨”來形容非結構化數據。

        他說:具有很多非常優美的特質令人愛它。

        一是內容完整性。結構化的數據不能描述真正的一個人或者一個事件或者一個項目或者一個物體,他沒有這個能力,它必須要借助于比如說表單應用系統,但是任何一個電子文件它一定是完整地準確地描述了某個事物。

        二是穩定性。Word文檔可編輯的穩定性都比表格里面的數據高很多,不可編輯 OFD或者PDF穩定性就更強了。

        三是能量大。我們到處可見各種形態的電子文件,80%的時間都在接觸各式各樣的、各種形態的過程的體系的成果的各個階段的電子文件,這說明它能量真的很大。

        他同時認為,非結構化數據也令人生恨。一是它的顆粒太大了,不像結構化數據是一個細顆粒度的,顆粒大就不愛交朋友,不愿意跟人家建立連接。結構化數據通過一個表就可以建立對象之間的關聯,還可以去計算。但是非結構化數據因為顆粒太大了,它很難去建立這個連接。所以非結構化數據現在需要花很大的精力將其結構化,要借助于結構化的手段,讓他更容易被關聯。

        二是不爭氣。企業的數據80%為非結構化數據,我們每日80%的時間是在接觸非結構化數據,數據價值的挖掘模型的生成80%來源于我們的非結構化數據,但是看看我們的行業是什么現狀?在設計工程行業,西南區域去年有差不多20多家企業核心的設計文件被勒索病毒軟件勒索掉,這還怎么談非結構化數據的管理?非結構化數據在市場上認知度太低,我覺得這也是我們需要建立標準的一個最關鍵原因。

        楊建梁表示:根據現在國內外對于非結構化數據的定義,簡單可以歸結,不能用二維表的邏輯來表示的,就屬于非結構數據。

        他認為理解非結構化數據的內涵特征之一,業務的憑證性或者憑證性的記錄,是在人們日常的生活、業務流轉過程中所形成的一切的信息,這個信息不一定非得要用二維表邏輯來處理。第二,非結構化數據都有一些語義性信息或者連續性信息。典型的例如在日常形成的一些報告、公文、視頻,它都有語義性、故事性、全面性的特點。

        董總監表示:無論結構化也好,非結構化也好,都是人類認知世界,記錄世界,表達世界的一種形式,區別在于是兩種思維的表現。結構化數據,其實是計算機思維一個典型的轉化,是有了計算機應用之后,人們為了去連接計算機,為了讓世界連接計算機,設計的一個結構化的東西,要不然計算機沒法處理。但是我們發現連接計算機并不是目的,人類是想通過計算機連接更多的人,所以最終非結構化數據才是連接世界最有效的、表達最好的一種手段。

        董總監說:因為是兩種不同的思維,所以無論怎樣結構化,也只能把已知的東西進行思維模式化,但是未知的領域就沒有模式,人的思維也是沒有辦法結構化的。舉例:同事說你笑得很燦爛,你用結構化來表達一下?你怎么結構化能夠形容那一刻的狀態是笑得很燦爛?他的多巴胺分泌多少?還是說這一刻的皺紋是起了幾道?結構化和非結構化在人和人、人和機器、人和物體之間的交流過程當中是相生相伴的,兩種輔助手段缺一不可。

        非結構化數據管理究竟能給企業帶來什么作用?

        張洪偉:實際上企業在應用非結構化數據的時候,應該把它理解為一個人文的概念,非結構化數據有很豐富的內容,格式上也并非嚴格按照表來存儲。在使用的過程中,是把它的一些關鍵的信息用結構化的形式提取出來,做一些聯想關聯,最終還是要回到非結構化。比如說圖紙,哪怕是用的三維設計軟件做的三維模型,它還是非結構化的,這是一個過程,我們是用計算機作為一個手段,最終還是要回到我們的世界,但這樣的手段能讓我們工作效率更高。

        羅永秀:對于企業群體的幫助就是方便找文件。不管是售前、銷售、生產還是技術支持,不會的問題一搜就找到,讓非結構化數據在業務過程能用起來,為我賦能,加速業務的工作的效率,我覺得這是對一般用戶最大的作用。

        對于IT管理者來說,數據的80%是非結構化數據,如果讓這些關鍵的數據游離在不同的業務系統里面,如果時不時哪臺文件服務器被勒索了,哪個文件被泄露了,想找文件但部門之間沒有打通……這些問題是與我們整個IT建設相關的。所以對IT信息管理者來說,建設一個統一的非結構化數據管理平臺,是國內所有企業必須要去思考,而且要盡快去行動的一個方向。

        第三個群體是安全和合規人員,制藥行業有一個強合規要求,藥品如果要上市,你如果不滿足GMP的質量要求是不能上市。國企央企我們有安全管理員,如果不對文件進行一個準確的定義,流轉沒有做到根據密級掛鉤,安全管理員就失職了,所以不管是安全人員還是管理人員,也必須要去做非結構化數據的建設。

        對于業務管理員來說,因為每個業務實際上都是有管理員,比如我是銷售運營中心的一個管理者,我的職責就要讓所有的銷售都知道我這個產品怎么賣、用什么樣的話術去賣、產品具有哪些特質和不足的地方,這就需要構建整個企業的一個非結構化數據的知識庫。

        最后對企業的高層來說,企業的經營,一定會遵循降本、增效、提質的規律要求,這都是跟非結構化數據有關的。

        所以對于企業組織來說,這5類群體都是需要對非結構化數據的管理和應用進行一個全方位的建設,意義是非常巨大的。

        企業的核心競爭力是在于規?;?,100個人能不能明天就變成200個人,后天就變成1000個人,規?;切枰芏嗟臉藴驶?,通過標準化去賦能擴張,這里面非結構化數據建設起到了一個關鍵的作用。

        陳亞軍:實際上非結構化數據是在人的活動中產生且服務于人,也比較貼近于人,都是圍繞著人類轉,但是如果整個業務都是特別的依賴于人,很多事情就會耽擱在人與人的交流上。同樣一個事情,有可能我拿著相同的材料今天去做,碰到心情不太好的人,這個事情就辦不成,明天他恢復了,這事就完成了。如果我們用上了非結構化數據就能夠避免這種不一致性。

        楊建梁:非結構化數據管理對于企業作用其實是一個很重要的問題。我對文件檔案相對要熟悉一些,文件的管理本質上是對一個公司或者一個機構業務流程的一個管控。信息集群或者數據集群在機構內,其實更直觀地表現為文件及權限。一文一事、一事一辦,是大多數機構的典型情況,在某些比較敏感的領域,尤其像核電領域,每進行一個流程,每辦一件事都是有文件把控的,文件簽了這個流程才能走得下去。文件就是非結構化數據的一個管理對象,非結構化數據管理的機制做得好,流程定的合規,對于文件的管理更有效,本質上就是對流程的管理是有效的。

        文件檔案的管理如果做得好可以帶來很大的便利。比如現在很多機構尤其是央企,很頭疼的一件事就是審計,每次審計的部門一來從上到下來來回回幾十趟,經常是幾個月時間就沒有了。但是審計部門的人其實很重要的部分就是查文件查檔案,一個合同的時間、簽署,雙方是否合規?是否符合審計規則?是否合法?這時如果文件或者是非結構化數據管理工作做得好的話,完全可以從數據庫或者是我們的內容管理平臺上把相關的信息拿出來,這樣的話就減少了大量的查檔、查文件的過程,效率得到了極大提升。

        非結構化數據是我們人類社會的一個直觀的表示、直觀的流程,其實反映在機構中它也是一個機構、一個團體的記憶的過程。經過幾十年之后,當我們再想看看企業成立之初那種精神,我們經歷過的事情,從中吸取一些精神力量的時候,我們可以通過非結構化數據來找到,前提是我們非結構化數據做得好且管理的好,否則我們也就失去了一個情懷,失去了我們的文化。

        董總監:數字化轉型對企業而言其實不是一個要不要去實現目標或目的,它其實已經是衡量一個企業具不具備持續發展的一種能力。因為這個世界已經是數字化的世界,你還不具備數字化的思維,還不具備數字化的連接能力,還不具備數字化的這種決策方式,其實就好像動物的生態被顛覆的過程當中,不適應變化就沒有辦法去跟原有的生態相處,出現新的異常的時候,你也沒有辦法去預防。所以對于企業來講,數字化的這種方式,無論是結構化的還是非結構化的,我們都需要具有這樣的管理能力。

        但企業數據管理能力往往在結構化數據方面強,非結構化的弱,這是與信息化的進程有關系。第一臺計算機“埃尼亞克”,美國國防大學那臺像房間一樣大的設備目的就是為了去做統計,統計本身就是一種結構化的思維。發展到現在,我認為非結構化其實剛剛起步,很多東西我們也沒有想明白,這對于企業來講其實是一個挑戰。但是企業想走得更遠就必須要面對,因為企業不能只靠技術和理性的左腦,需要有文化。流程是典型的結構化,但是流程執行得好或者差是非結構化的東西起作用。就比如一個人的能力是不能用結構化闡述的,對一個事情、一個階段的描述往往影響流程的效率,而這個描述又未必是結構化的。所以,非結構化管理能力的提升,對于企業數字化轉型是非常重要的一個手段,必須要面對。做不好,企業可能就會缺少溫度,企業管理要有溫度,應該是40度還是60度還是30度,它就是非結構化的。所以,我特別認同文化和非結構化的連接更加有效。

        像今天會議,可以把這個會議分成三部分,也可以根據角色,有主持人、演講嘉賓,這是結構化。但是從頭至尾下來的這些內容,不能要求按結構化的方式跟大家講。企業也是這樣,我們的創新、內部的教育、人員的成長,那是不可復制的,但恰恰需要分享。

        非結構化數據管理應該要什么樣的標準化?

        張洪偉:非結構化數據進行標準化,實際上做起來是挺復雜的一個事情。非結構化數據的類型太多了,轉換能力每種文件都不一樣。還有管理方式,比如鴻翼的平臺就提供一種管理方式。但是還有很多系統也在管理著非結構化數據,不可能所有的都能統一過來。這需要整個行業還有軟件界的共同努力,提升格式、平臺、平臺和平臺之間的交換能力,這時候標準就很重要。需要大家團結起來制定一些標準規范,大家都按照這個做,團隊集團效應就出來了,整個價值就體現出來了。

        羅永秀:標準重要的意義有兩個方面。第一個方面站在一個行業的維度,如果我們把小型企業微型企業、中型企業、大規模企業都算在一起,那么,國內對非結構化數據管理整體規劃的認知度只有1/10。如果認知度非常普遍的話,就不會出現一些基礎性的問題。非結構化數據有那么多環節,現在連最基礎的存儲都沒搞好,顯然在意識層面就存在問題。所以去制定發布這樣的標準,能成為DCMM(《數據管理能力成熟度評估模型》)的一個配套,是對數據管理工作的推動,是對我們國家數字經濟的促進,是一個非常重要的事情。所以這個標準的制定跟推廣責任重大,關乎著行業里那么多不同規模的企業的數字資產。

        第二個層面,我們的客戶、規則、工程、邏輯、產品、機器這些全是現實世界,數字化的結果是數據,數據80%又是非結構化數據,然后基于這些非結構化數據,再去調優,去優化,去革新我們的現實世界。數字化轉型又包含了很多方面,數字化的運營、數字化營銷、數字化制造,不管是哪個方向的數字化,數據80%的非結構化數據的核心地位是不可撼動的,也就是說數字化轉型更多要靠占數據80%的非結構化數據。需要思考如何讓非結構化數據從現實世界數字化,如何基于這些非結構化數據進行各種的分析、價值的挖掘,驅動我們現實世界的各種的優化、升級、革新。

        楊建梁:首先,標準化是肯定要做的。計算機中有一個名字叫互操作性,就是說你能操作我也能操作。這個邏輯在我們人類社會中也是如此。例如普通話,我講方言大家聽不懂,這說明我們沒有做好標準,沒有達到標準化,所以我們沒法溝通。在一個行業內,對于非結構化的數據來說,標準化就意味著不同的系統不同的機構之間數據是可以互相溝通、互相連通的,對管理者意味著同一套管理系統、一套管理體系,能夠在各個行業、各個公司之間通用,邁向整個社會、邁向國際化的一個基本要求就是標準化。

        在電子文件和檔案管理領域標準是非常豐富的。不僅僅有成熟度模型,成熟度模型本身是管理效果的要求。而對于非結構化數據本身,數據的結構、數據的質量也需要做標準化,非結構化數據的元數據也需要做標準化,非結構化數據的管理系統建設也需要標準化,包括后續的質量、數據、結構都需要標準化,才能夠把非結構化數據管理推向正軌,這也是我們做標準化的一個重要的意義,是我們需要繼續努力的。

        董總監:把非結構化的數據通過一種結構化思維去管理,實際上就是要在非結構化的數據的傳輸存儲以及協作的過程當中給一定的規則。其實在虛擬世界里定標準是最重要的,因為在虛擬世界里它是突破了現實世界的認知的。對于整個的文檔系統,比如說報批國際注冊的一些藥品,其實是通過非結構化的數據報文件,但文件現在已經有了一套結構化的工具,相當于是給你一套文檔的頭文件,把相應的東西裝進去就可以識別進行交流,這其實就是非結構化數據的標準化往前發展的一個過程。

        現在AI對于非結構化的認知,其實是超出了我們現有的現實手段,所以對于非結構化未來這個標準,我抱有很高的期望,因為它能夠對未來現實世界進行改造,用虛擬世界去對現實世界的不確定性作出預測,用虛擬的一套思維邏輯對現實世界重新進行思考,這是我們可能在現實當中能夠脫穎而出,能夠解決一些現實當中沒有辦法解決的問題的時候要考慮的。比如說要模擬一個車禍,你沒辦法在現實的情況下展示那種創傷的沖擊力。所以這些標準能夠讓我們對未來數字化的認識、理解加速,帶來一些思考的邏輯和方法,使數字化展示能夠加速,所以對于標準的建設,致以崇高敬意。

        陳亞軍:標準第一個作用就是把大家的概念思維的方式統一起來,最權威的解釋永遠不是在字典里面,而是在標準里面。

        第二個作用,標準最大的一個導向就是簡化,簡化以后所有的適配減少,效率提升。在文件格式這塊,標準院做基礎文件、基礎數據的時候,把電子文件分為文書類、音視頻類,在每一類里面只推一種模式。這也是標準化的理念對現在面臨的一個問題給出了一個解決的方案,但這不一定是唯一的解決方案,這是我們目前的方案。


        2020伦韩国理论片在线观看_男人下部进女人下部免费_俄罗斯女人与动z0z0_国产美女无遮挡裸色视频