歡迎訪問廈門信息集團大數據運營有限公司網站(zhàn)!
0551-65909059   公司OA
聯系電話(huà):
當前位置:首頁>>新聞中心>>行業動态 >>預見未來(lái) | 數據智能(néng)的現(xiàn)在與未來(lái)
今天是: 2024年07月29日   【農(nóng)曆:六月廿四】  星期一
預見未來(lái) | 數據智能(néng)的現(xiàn)在與未來(lái)
<p class="MsoNormal"> <b><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">本文(wén)經授權轉載自(zì)公衆号微軟研究院<span>AI</span>頭條(<span>ID</span>:<span>MSRAsia)</span></span></b> </p> <p style="text-align:justify;text-indent:23.6pt;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">我們正處于大(dà)數據和(hé)數字化轉型的時(shí)代:數據無處不在;運用(yòng)數據驅動的思想和(hé)策略在實踐中逐漸成爲共識;數據的價值已在科學研究和(hé)工(gōng)商業的不同領域得到(dào)充分展現(xiàn)。然而,如果無法從(cóng)數據中提取出知(zhī)識和(hé)信息并加以有效利用(yòng),數據本身并不能(néng)驅動和(hé)引領數字化轉型取得成功。如何讓數據發揮它最大(dà)的價值?“數據智能(néng)”<span>(Data Intelligence) </span>應運而生。<span></span></span> </p> <p style="text-align:center;text-indent:23.6pt;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;"><img src="static/picture/150.png" width="700" height="481" alt="" /><br /> </span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據智能(néng)是一個跨學科的研究領域,它結合大(dà)規模數據處理(lǐ)、數據挖掘、機器學習、人機交互、可視(shì)化等多種技術,從(cóng)數據中提煉、發掘、獲取有揭示性和(hé)可操作(zuò)性的信息,從(cóng)而爲人們在基于數據制定決策或執行任務時(shí)提供有效的智能(néng)支持。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">如果将數據視(shì)爲一種新的“石油”,那麽數據智能(néng)就是“煉油廠(chǎng)”</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。數據智能(néng)通過分析數據獲得價值,将原始數據加工(gōng)爲信息和(hé)知(zhī)識,進而轉化爲決策或行動,已成爲推動數字化轉型不可或缺的關鍵技術。數據智能(néng)的重要性越來(lái)越凸顯,并在近年來(lái)取得快(kuài)速發展。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據智能(néng)技術賦予我們探求數據空(kōng)間中未知(zhī)部分的能(néng)力,在不同領域裏蘊育出巨大(dà)的機會(huì)。<strong>衆多基于互聯網的新型業務,包括搜索引擎、電子商務以及社交媒體應用(yòng)等,從(cóng)本質上(shàng)就是建立和(hé)運作(zuò)在數據智能(néng)的基礎之上(shàng)</strong>。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據智能(néng)技術正在重塑傳統的商業分析或商業智能(néng)領域。根據<span>Gartner</span>的調研,一種新的 “增強分析”的分析模式正在颠覆舊有方式,預計(jì)在幾年内将成爲商業智能(néng)系統采購的主導驅動力。這(zhè)種“增強分析”模式正是由數據智能(néng)技術賦能(néng),提供了(le)自(zì)然語言查詢和(hé)叙述、增強的數據準備、自(zì)動的高(gāo)級分析、基于可視(shì)化的數據探索等多種核心能(néng)力。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">那麽,數據智能(néng)領域的技術進展如何?未來(lái),數據智能(néng)的研究又有哪些(xiē)熱點?<span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span></span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p class="MsoNormal" align="left" style="text-align:left;"> <strong><span style="font-size:13.5pt;font-family:宋體;color:#D83B01;">數據智能(néng)的技術進展</span></strong><span></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據智能(néng)相關的核心技術大(dà)緻可以分爲數據平台技術、數據整理(lǐ)技術、數據分析技術、數據交互技術、數據交互技術、數據可視(shì)化技術等部分</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。與傳統意義上(shàng)的數據處理(lǐ)、數據分析相比,數據智能(néng)面臨很(hěn)多新挑戰、新問題。在解決這(zhè)些(xiē)問題和(hé)挑戰的過程中,各種技術創新層出不窮。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#D83B01;background:white;">大(dà)數據系統與平台</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">爲了(le)支持大(dà)規模的數據處理(lǐ)與分析任務,全新的數據存儲系統需要能(néng)夠容納和(hé)支持高(gāo)效數據吞吐、高(gāo)可伸縮性和(hé)高(gāo)容錯性。傳統的數據庫<span>OLTP</span>面向交易型需求而設計(jì),無法滿足大(dà)數據統計(jì)分析類的查詢需求和(hé)應用(yòng)。當前的大(dà)數據系統更加強調讀寫效率、數據容量以及系統的可擴展性。具體來(lái)說,将數據分割成塊,并将每塊複制多份後分散到(dào)不同物理(lǐ)機器上(shàng)存儲,用(yòng)冗餘的數據塊來(lái)防止因個别機器損壞對(duì)數據完整性的影響。數據的冗餘保存不但(dàn)提高(gāo)了(le)系統的可靠性,同時(shí)也(yě)可以提高(gāo)了(le)系統在數據讀取時(shí)的并發性能(néng)。另外(wài),爲降低(dī)成本,現(xiàn)代的大(dà)數據系統運行在價格相對(duì)低(dī)廉的普通服務器上(shàng);這(zhè)些(xiē)機器通過高(gāo)速網絡連接,實現(xiàn)高(gāo)效的數據傳輸。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">處理(lǐ)和(hé)分析大(dà)數據涉及大(dà)量的計(jì)算(suàn),催生了(le)很(hěn)多分布式<span>NoSQL</span>數據處理(lǐ)系統。在計(jì)算(suàn)模型上(shàng),<span>MapReduce</span>的推出給大(dà)數據并行處理(lǐ)帶來(lái)了(le)革命性的影響。在<span>MapReduce</span>基礎上(shàng)進一步提出了(le)新的計(jì)算(suàn)模型<span>Spark</span>。<span>Spark</span>充分利用(yòng)在内存中計(jì)算(suàn)的優勢,并且大(dà)大(dà)優化了(le)原來(lái)<span>MapReduce</span>中<span>Shuffle</span>所帶來(lái)的效率問題。經過幾年的發展,<span>Spark</span>已經替代<span>MapReduce</span>成爲業界最爲重要的大(dà)數據處理(lǐ)框架,并且發展了(le)非常豐富的應用(yòng)生态。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">此外(wài),基于流<span> (Streaming) </span>的計(jì)算(suàn)模型被開(kāi)發出來(lái)以支持不斷變化和(hé)更新的大(dà)數據應用(yòng)。在流計(jì)算(suàn)模型中,爲了(le)達到(dào)更實時(shí)的更新,每到(dào)達一個數據事(shì)件的時(shí)候就進行一次處理(lǐ)。<span>Spark Streaming</span>、<span>Storm</span>、<span>Flink</span>都是比較流行的流計(jì)算(suàn)平台。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">在支持對(duì)大(dà)數據進行在線交互式的查詢和(hé)分析方面,來(lái)自(zì)不同領域的技術正在快(kuài)速融合,共同構建更加實時(shí)高(gāo)效的大(dà)數據交互查詢平台。以<span>ElasticSearch</span>爲代表的一類技術,借鑒搜索系統的索引構架和(hé)技術,對(duì)大(dà)規模非結構化和(hé)半結構化數據進行分塊、索引來(lái)支持快(kuài)速查詢。以<span>Apache Kylin</span>爲代表的另一類技術則将傳統的數據立方體技術推廣到(dào)大(dà)數據領域,通過将預先計(jì)算(suàn)的部分數據立方體緩存起來(lái),大(dà)大(dà)提高(gāo)了(le)運行時(shí)的查詢速度。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">随着技術的發展,對(duì)數據進行高(gāo)語義級别的自(zì)動分析變得越來(lái)越重要。自(zì)動分析技術往往需要頻繁計(jì)算(suàn)在不同查詢條件下(xià)的聚合結果,一個分析查詢可能(néng)涉及成百上(shàng)千次簡單的聚合查詢。這(zhè)就對(duì)查詢性能(néng)提出了(le)更高(gāo)的要求。爲了(le)解決這(zhè)個問題,同時(shí)也(yě)考慮到(dào)大(dà)數據分析中絕大(dà)多數任務對(duì)數據的完整性不太敏感這(zhè)一特點,學術界又提出了(le)<span>BlinkDB</span>、<span>BigIN4</span>等技術和(hé)系統,希望利用(yòng)通過采樣或者預計(jì)算(suàn)得到(dào)的部分數據來(lái)對(duì)用(yòng)戶的查詢結果進行估計(jì),從(cóng)而達到(dào)快(kuài)速計(jì)算(suàn)的目的。其中<span>BlinkDB</span>試圖利用(yòng)分層采用(yòng)的方法來(lái)減少估計(jì)的誤差,而<span>BigIN4</span>則試圖通過貝葉斯估計(jì)方法來(lái)優化用(yòng)戶查詢的估計(jì)誤差。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#D83B01;background:white;">基于自(zì)然語言的交互</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">爲了(le)降低(dī)數據分析的門(mén)檻,使用(yòng)自(zì)然語言作(zuò)爲交互方式顯然是一個理(lǐ)想方案</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">,可以極大(dà)地方便普通用(yòng)戶快(kuài)速、有效地進行數據探索與數據分析。近年來(lái),随着自(zì)然語言處理(lǐ)和(hé)人工(gōng)智能(néng)技術的快(kuài)速進步,使用(yòng)自(zì)然語言來(lái)查詢和(hé)分析數據變得更加可能(néng)。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">自(zì)然語言數據分析要解決的最重要的問題是語義解析。語義解析技術是将自(zì)然語言直接轉化成可以執行的程序<span> (</span>例如<span> SQL</span>語句<span>)</span>。基于關系數據庫<span>/</span>數據表的語義解析技術是解決自(zì)然語言交互式查詢的重要途徑。早期主要采用(yòng)基于模式匹配的方法,後來(lái)出現(xiàn)了(le)基于語法分析與語義分析的第二代方法。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">近年來(lái),随着深度學習技術的發展,湧現(xiàn)出了(le)一系列的端到(dào)端的語義解析模型。一般的端到(dào)端模型采用(yòng)<span>sequence-to-sequence</span>的方法,将自(zì)然語言進行序列編碼,然後逐步生成<span>SQL</span>語句,但(dàn)是這(zhè)種方法的缺點是容易産生不正确的或者不可執行的<span>SQL</span>語句。因此,在端到(dào)端的方法的基礎上(shàng)會(huì)融合各種知(zhī)識來(lái)減少搜索空(kōng)間,增加約束,包括嵌入<span>SQL</span>語法知(zhī)識,引入表格信息,甚至是引入外(wài)部的知(zhī)識庫,比如<span>WordNet</span>。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#D83B01;background:white;">分析的自(zì)動化</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據分析是數據智能(néng)中最核心的部分,大(dà)緻可以分爲描述性分析、診斷性分析、預測性分析、指導性分析等四個類别,每個類别基于數據回答(dá)不同的問題,難度越來(lái)越大(dà),所能(néng)帶來(lái)的價值越來(lái)越高(gāo),所使用(yòng)的技術也(yě)越來(lái)越複雜(zá)。數據智能(néng)分析工(gōng)具的發展經曆了(le)如下(xià)四個重要的階段和(hé)層次。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">階段<span>1</span></span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">:數據智能(néng)專家深入學習和(hé)了(le)解特定領域的問題,構建端到(dào)端<span> (end-to-end)</span>的分析流程和(hé)平台,以特定領域的數據分析師爲主要用(yòng)戶,以解決特定領域的專業問題爲主要任務。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">階段<span>2</span></span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">:數據智能(néng)專家通過對(duì)各個領域的深刻總結,提煉出在不同領域的任務中所共同依賴的一些(xiē)必要的需求單元,比如分布差異分析、主驅動因素分析、預測分析等等。把各個需求單元對(duì)應的數據智能(néng)技術以積木(mù)塊搭建的形式組成一個分析平台,提供給各個領域使用(yòng)。用(yòng)戶按照自(zì)己分析任務的需求,可以在分析流程中選擇相應的技術模塊。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">階段<span>3</span></span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">:進一步發揮機器的“智能(néng)”性,在分析任務的各個環節,通過主動提供相關洞察<span> (Insight) </span>的形式,爲用(yòng)戶的下(xià)一步決策或行動提供信息充足的引導性建議(yì),從(cóng)而更大(dà)程度地提高(gāo)人類智能(néng)與機器智能(néng)的互補,完成更高(gāo)效的協作(zuò)。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">階段<span>4</span></span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">:在前三個階段中,數據的處理(lǐ)、特征的選取、模型的設計(jì)以及參數的優化等等核心環節嚴重依賴于機器學習專家的知(zhī)識和(hé)技能(néng)。随着機器學習理(lǐ)論的進一步發展,<span>Auto ML</span>技術開(kāi)始出現(xiàn)并發展起來(lái),其核心是基于對(duì)已有機器學習成果的總結,将上(shàng)述重要環節進行系統化的抽象,并結合不斷快(kuài)速發展的計(jì)算(suàn)機處理(lǐ)能(néng)力,使其逐漸自(zì)動化,從(cóng)而進一步降低(dī)數據智能(néng)模塊的開(kāi)發門(mén)檻,拓寬對(duì)長尾任務的支持,推動人類智能(néng)和(hé)機器智能(néng)的進一步融合,也(yě)使不同領域的普通用(yòng)戶以自(zì)助方式按需定制針對(duì)具體任務的數據智能(néng)模塊變得可能(néng)。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#D83B01;background:white;">數據融合的自(zì)動化</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">如何有效整理(lǐ)、融合如此多樣且繁雜(zá)的數據對(duì)于數據智能(néng)領域非常重要。數據融合的相關技術在整體上(shàng)需要解決以下(xià)關鍵問題。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">首先,在機器從(cóng)數據中獲取智能(néng)之前,機器能(néng)夠正确地讀懂各種各樣的數據</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。對(duì)于機器友好(hǎo)的數據是類似關系數據庫的結構化數據。然而,現(xiàn)實世界裏存在着大(dà)量的非結構化數據,比如自(zì)然語言的文(wén)本;還有介于兩者之間的半結構化數據,比如電子表格。目前機器還很(hěn)難理(lǐ)解這(zhè)些(xiē)非結構化的方面,需要将數據處理(lǐ)成對(duì)機器友好(hǎo)的結構化數據,機器才能(néng)發揮其特長,從(cóng)數據中獲取智能(néng)。非結構化數據、尤其是半結構化數據向結構化數據的轉化,是實現(xiàn)數據智能(néng)不可或缺的先決任務。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">其次,數據并不是孤立的,數據智能(néng)需要充分利用(yòng)數據之間存在的關聯</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">,把其他(tā)數據源或數據集所涵蓋的信息傳遞并整合過來(lái),可以爲數據分析任務提供更豐富的信息和(hé)角度。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">最後,數據并不是完美(měi)的,提前檢測并修複數據中存在的缺失或錯誤</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">,是保障數據智能(néng)得出正确結論的重要環節。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#D83B01;background:white;">數據可視(shì)化</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據可視(shì)化本質上(shàng)是爲了(le)感知(zhī)和(hé)溝通數據而存在的</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">,涉及到(dào)不同的領域,諸如人機交互、圖形設計(jì)、心理(lǐ)學等。在當前大(dà)數據盛行的時(shí)代,數據可視(shì)化逐漸嶄露頭角,扮演着越來(lái)越重要的角色。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">可視(shì)化技術用(yòng)于分析,已成爲數據智能(néng)系統不可或缺的部分。這(zhè)些(xiē)技術通常會(huì)集成在一個圖形界面上(shàng),展示一個或多個可視(shì)化視(shì)圖。用(yòng)戶直接在這(zhè)些(xiē)視(shì)圖上(shàng)進行搜索、挑選、過濾等交互操作(zuò),對(duì)數據進行探索和(hé)分析。可視(shì)化工(gōng)具進一步趨于簡單化、大(dà)衆化,使一些(xiē)高(gāo)階的分析變得更加簡單。一些(xiē)高(gāo)級的可視(shì)化設計(jì),如<span> Word Cloud</span>、<span>Treemap</span>、<span>Parallel Coordinates</span>、<span>Flowmap</span>、<span>ThemeRiver</span>等,也(yě)逐步成爲主流。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">在決策過程中,可視(shì)化也(yě)發揮着重要的作(zuò)用(yòng),它能(néng)将信息展示得更準确、更豐富、更容易理(lǐ)解,從(cóng)而極大(dà)提高(gāo)人與人之間的溝通效率。可視(shì)化叙事(shì)<span> (visual storytelling) </span>研究如何将可視(shì)化用(yòng)于信息的展示和(hé)交流。當今主流的數據分析平台,例如<span>Power BI</span>、<span>Tableau</span>、<span>Qlik</span>等,都提供了(le)可視(shì)化叙事(shì)的模式。可視(shì)化叙事(shì)的研究目前還處在一個比較早期的階段,人們還在探索它的各個方面,例如修飾形式、叙事(shì)方式、交互手段、上(shàng)下(xià)文(wén)、記憶性等。如何評估一個可視(shì)化叙事(shì)也(yě)有待進一步研究。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#D83B01;background:white;">基于隐私保護的數據分析</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">近年來(lái),随着數據隐私問題成爲關注的焦點,以及相關數據保護的立法<span> (</span>比如<span>GDPR) </span>開(kāi)始實施,研究人員開(kāi)始積極探索保護隐私的數據分析技術,即在保護數據隐私的情況下(xià),對(duì)數據進行管理(lǐ)和(hé)處理(lǐ)。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">一個方向是提供可信計(jì)算(suàn)環境去執行敏感操作(zuò)</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。用(yòng)戶的數據始終是加密的,隻有在可信計(jì)算(suàn)的環境中才會(huì)解密及處理(lǐ)。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">另一個方向是直接對(duì)加密數據進行處理(lǐ)得到(dào)想要的結果</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">,因爲數據沒有解密,隐私得到(dào)了(le)保證。選擇性加密技術早已廣泛應用(yòng)于多媒體内容保護,但(dàn)很(hěn)難擴展到(dào)其他(tā)類型的數據。另一種适用(yòng)性更廣的方法是同态加密,它允許對(duì)密文(wén)進行某些(xiē)同态操作(zuò),例如加法和(hé)<span>/</span>或乘法,使得密文(wén)下(xià)的運算(suàn)結果在解密後與對(duì)明(míng)文(wén)執行相應操作(zuò)的結果一緻。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p class="MsoNormal" align="left" style="text-align:left;"> <strong><span style="font-size:13.5pt;font-family:宋體;color:#0078D7;background:white;">數據智能(néng)技術的未來(lái)熱點</span></strong><span></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據智能(néng)研究契合當今大(dà)數據時(shí)代各領域、各行業從(cóng)數據中挖掘、實現(xiàn)價值,進行數字化轉型的迫切需要,因而在近年來(lái)得到(dào)了(le)充分重視(shì),發展迅速。随着數據智能(néng)在更多領域的落地和(hé)發展,新的應用(yòng)和(hé)場景、新的問題和(hé)挑戰将進一步激發和(hé)驅動數字智能(néng)研究保持強勁的發展勢頭,邁向更高(gāo)的層次。展望未來(lái),數據智能(néng)技術将朝着更自(zì)動、更智能(néng)、更可靠、更普适、更高(gāo)效的方向繼續發展。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>1</span>:在更高(gāo)的語義理(lǐ)解水(shuǐ)平上(shàng)進行分析</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">爲了(le)更加智能(néng)地分析數據,需要對(duì)數據有更加豐富的語義理(lǐ)解。與知(zhī)識圖譜<span> (Knowledge Base) </span>不同,雖然數據分析中最常用(yòng)的關系數據模型也(yě)是對(duì)實體和(hé)關系的建模,但(dàn)是關系數據模型的建模是爲查詢和(hé)存儲性能(néng)而優化的,往往丢失了(le)大(dà)量語義信息。如何引入領域知(zhī)識和(hé)常識型知(zhī)識對(duì)于更好(hǎo)地理(lǐ)解數據至關重要。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">如何從(cóng)表格數據和(hé)其他(tā)容易獲得的文(wén)本數據<span> (</span>如<span>web</span>網頁<span>) </span>中自(zì)動獲取語義信息來(lái)增強和(hé)豐富表格數據是一個需要研究的重要方向</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。比如,确定表格中行或列的實體類型<span>(</span>包括人名、地名、機構名等命名實體以及時(shí)間、地址、貨币等數據類型<span>)</span>。表格往往不具有文(wén)本中的豐富的上(shàng)下(xià)文(wén)信息,因此表格中的實體識别不同于其他(tā)自(zì)然語言處理(lǐ)任務中的實體識别,十分具有挑戰性。除了(le)處理(lǐ)實體識别外(wài),數據表格中實體關系的挖掘和(hé)分析也(yě)至關重要。充分挖掘實體之間的關聯關系可以完成一些(xiē)實體類型的推薦和(hé)回答(dá)數據分析的問題。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>2</span>:構造通用(yòng)知(zhī)識和(hé)模型的框架</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">人類對(duì)知(zhī)識和(hé)方法能(néng)夠舉一反三,觸類旁通。具體到(dào)數據分析領域,分析中用(yòng)到(dào)的知(zhī)識和(hé)模型需要在不同數據對(duì)象和(hé)分析任務之間共享和(hé)遷移。在機器學習領域,已經有很(hěn)多相關工(gōng)作(zuò),也(yě)提出了(le)一些(xiē)方法,比如遷移學習、多任務學習、預學習模型等等。要<strong>實現(xiàn)這(zhè)個“舉一反三”的目标</strong>,除了(le)需要深入研究具體的機器學習算(suàn)法,也(yě)需要從(cóng)模型和(hé)知(zhī)識的框架體系來(lái)思考,研究适合數據分析領域的通用(yòng)知(zhī)識和(hé)模型的原語體系,以及知(zhī)識和(hé)模型的遷移共享的統一框架。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>3</span>:建立高(gāo)質量的訓練數據集和(hé)基準測試數據集</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">由于訓練數據的缺乏,人工(gōng)智能(néng)、深度學習等技術在數據智能(néng)領域的進一步應用(yòng)遇到(dào)了(le)很(hěn)大(dà)的困難。正如<span>ImageNet</span>數據對(duì)于計(jì)算(suàn)機視(shì)覺領域的研究起到(dào)了(le)顯著的推動作(zuò)用(yòng)一樣,<strong>數據智能(néng)領域的研究也(yě)亟需建立起一整套公用(yòng)的大(dà)規模、高(gāo)質量的訓練數據集和(hé)基準測試數據集</strong>。一旦有了(le)豐富的訓練數據,數據智能(néng)領域的很(hěn)多研究,諸如自(zì)動分析、自(zì)然語言交互、可視(shì)化推薦等等,将會(huì)取得突破性的進展。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>4</span>:提供具有可解釋性的分析結果</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">用(yòng)戶将不再滿足于僅僅依賴黑盒式的智能(néng)、端到(dào)端地作(zuò)用(yòng)于整個任務,而<strong>需要更細粒度的、有針對(duì)性的、更透明(míng)的數據智能(néng)</strong>。例如,數據智能(néng)用(yòng)于财務審計(jì)系統中,準确推薦最有風(fēng)險的交易記錄進行優先審查,以達到(dào)在最小(xiǎo)化系統風(fēng)險的前提下(xià),最大(dà)化審計(jì)效率。在這(zhè)類系統的研發中,需要構建可理(lǐ)解性強的模型。在推薦高(gāo)風(fēng)險交易記錄的同時(shí),盡量提供系統是依據哪部分信息、通過怎樣的邏輯判斷這(zhè)是一條高(gāo)風(fēng)險交易的相關依據。這(zhè)與過去通常使用(yòng)的黑盒技術路線有了(le)明(míng)顯的變化,将成爲今後技術發展的一個趨勢。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>5</span>:人類智能(néng)和(hé)機器智能(néng)更加緊密融合</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">現(xiàn)有人工(gōng)智能(néng)技術從(cóng)本質上(shàng)依然隻是被動服從(cóng)人類設定的既定邏輯然後自(zì)動地運行,歸根到(dào)底還是無法突破人類傳授的學習框架,沒有創造力。因此在可預見的未來(lái),數據智能(néng)将依然無法擺脫人與機器協作(zuò)的模式,需要全面地總結人類在數據分析方面的智能(néng)和(hé)經驗,便于轉化爲機器算(suàn)法,系統化地集成到(dào)已有的智能(néng)系統當中。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>6</span>:強大(dà)的指導性分析成爲主流</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">數據分析的核心目标之一便是指導行動,無論分析得有多好(hǎo),如果不采取行動,那麽分析的價值就不會(huì)得到(dào)實質的體現(xiàn),這(zhè)就是指導性分析的重要價值所在。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">例如,根據詳盡的分析,數據智能(néng)預測某品牌在接下(xià)來(lái)一個季度的銷量會(huì)下(xià)滑<span>10%</span>。如果分析任務結束于此,那麽數據智能(néng)并沒有盡到(dào)全部的責任,人還需要根據後續分析結合自(zì)己的經驗去搞清楚怎樣才能(néng)減輕甚至避免潛在的銷量下(xià)滑。相應的指導性分析可以是,如果想保持下(xià)季度銷量不下(xià)滑,應該采取怎樣的行動。指導性分析的結果可以是把某一類子産品的産量減少<span>20%</span>,同時(shí)把另兩類子産品的産量各增加<span>10%</span>等等。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">現(xiàn)在的數據智能(néng)技術在給出指導性分析的同時(shí),并沒有具備足夠解釋性的模型,無法提供充足的依據,從(cóng)而不足以讓人類用(yòng)戶充分信任自(zì)動推薦的結果。<strong>提供具有更好(hǎo)解釋性的指導性分析是一個趨勢</strong>。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>7</span>:基于隐私保護的數據分析更加成熟完善</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">通過從(cóng)立法、技術、到(dào)用(yòng)戶參與等全方位的共同努力,隐私保護将被進一步納入到(dào)未來(lái)的數據分析中</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。從(cóng)技術層面<span>, </span>應該确保個人數據由數據主體控制如何收集、管理(lǐ)、處理(lǐ)和(hé)共享,并在整個生命周期得到(dào)保護,同時(shí)應開(kāi)發并部署保護隐私的數據處理(lǐ)技術,以便在保護隐私的前提下(xià),數據得以處理(lǐ)并獲得想要的結果。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>8</span>:智能(néng)分析助手得到(dào)普及</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">智能(néng)代理(lǐ)<span> (Intelligent Agent) </span>技術與數據分析技術的融合是一個重要的方向</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。在不久的将來(lái),智能(néng)的數據分析助手能(néng)夠幫助人類更加高(gāo)效地分析和(hé)利用(yòng)數據。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">這(zhè)些(xiē)數據分析智能(néng)助手通過自(zì)然語言對(duì)話(huà)的方式與人交流數據分析的任務和(hé)結果,理(lǐ)解分析的背景和(hé)上(shàng)下(xià)文(wén),可以完成人類交給的特定數據分析任務 <span>(</span>根據分析的語義層級不同,可分爲基本分析命令和(hé)高(gāo)級數據挖掘任務<span>)</span>,也(yě)可以把具有商業價值的數據事(shì)實推薦給相關人類用(yòng)戶<span> (</span>比如自(zì)動從(cóng)數據中挖掘到(dào)的數據洞察<span>)</span>,并對(duì)某些(xiē)數據事(shì)件做出智能(néng)判斷和(hé)适當的反應<span> (</span>比如自(zì)動對(duì)數據中需要注意的變化進行提示和(hé)警報(bào)<span>)</span>。這(zhè)樣的智能(néng)體還具有一定的學習能(néng)力,能(néng)夠通過與人類分析師的對(duì)話(huà)交流積累特定領域的知(zhī)識,從(cóng)而能(néng)夠更加具有針對(duì)性和(hé)更加智能(néng)地進行自(zì)動數據分析。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>9</span>:協作(zuò)化的可視(shì)分析</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">随着各種溝通工(gōng)具的興起和(hé)普及,協作(zuò)化的可視(shì)分析會(huì)成爲熱點</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。不同于傳統的面對(duì)面、小(xiǎo)規模的協作(zuò),新的協作(zuò)分析往往是異步的和(hé)大(dà)規模的,人們在不同的時(shí)間和(hé)地點,使用(yòng)不同的設備,對(duì)同一個數據進行可視(shì)分析。在此過程中,如何協調人們的協作(zuò)?如何避免重複性的工(gōng)作(zuò)?如何保證不同人在不同的顯示終端上(shàng)看(kàn)到(dào)的數據是一緻的?如何共享各種信息?如何搭建一個高(gāo)效的協作(zuò)平台?這(zhè)些(xiē)都是需要解決的技術挑戰。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:13.5pt;font-family:&quot;color:#0078D7;background:white;">熱點<span>10</span>:可視(shì)化将無所不在</span></strong><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">在更長遠的将來(lái),我們相信<strong>可視(shì)化終将變得透明(míng)</strong>。就像文(wén)字和(hé)語音(yīn)一樣,廣泛滲透到(dào)我們的日常生活中。爲此需要有三個方面的技術儲備:</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">首先,可視(shì)化視(shì)圖必須能(néng)夠被快(kuài)速地生産和(hé)消費</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。目前,多數可視(shì)化視(shì)圖的生成還是離不開(kāi)人的參與,但(dàn)是在人工(gōng)智能(néng)的幫助下(xià),未來(lái)在人工(gōng)智能(néng)的幫助下(xià),可視(shì)化視(shì)圖将能(néng)被大(dà)規模和(hé)精确地生成,從(cóng)而大(dà)大(dà)降低(dī)可視(shì)化創作(zuò)的開(kāi)銷。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">其次,要進行交互方式的變革</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。傳統的基于鍵盤、鼠标的交互模式不是最自(zì)然的方式,各種人類更習慣的方式<span> (</span>例如手勢、筆(bǐ)紙(zhǐ)、觸控等<span>) </span>需要慢慢演化成更成熟的交互手段。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <p style="margin-left:6.0pt;text-align:justify;background:white;"> <strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">最後,需要顯示設備的普及</span></strong><span style="font-size:11.0pt;font-family:&quot;color:#333333;background:white;">。顯示設備終将被集成到(dào)人的生活中去,無論是穿戴式的、手持的,還是出現(xiàn)在人們日常生活的物品表面上(shàng)的。隻有當顯示設備無處不在的時(shí)候,可視(shì)化才能(néng)真正變成一種溝通的基本方式。</span><span style="font-size:12.5pt;font-family:&quot;color:#333333;"></span> </p> <br />