曰本特黄大片一级_无码国产精品久久区免费_欧美色橹橹在线_五月天丁香综合_亚洲gay免费网址_老师婷婷激情五月天av福利_中文字幕A片视频一区二区_亚洲高清不卡免费

公司介紹 新聞動態(tài) 聯(lián)系我們
知識圖譜:從“數(shù)據(jù)”競爭到“技術(shù)”競爭
2021-07-06來源: Amber Dr.Huang作者: Amber Dr.Huang

|“用知識圖譜定位客戶,可防失聯(lián)/跑路?!?/span>

或許你已經(jīng)耳熟能詳人工智能,但是對此你并不滿意。你吐槽:這個機器太愚蠢了!這個分析報告,人類根本無法理解。

那是因為人工智能還是一個牙牙學(xué)語的稚子,處于智能化轉(zhuǎn)型的初級階段。今天我們就來聊聊知識圖譜,一項將賦予機器認(rèn)知智能的關(guān)鍵技術(shù)。

知識圖譜:從“數(shù)據(jù)”競爭到“技術(shù)”競爭
(圖片來源于網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系刪除

一、什么是知識圖譜?

知識圖譜(Knowledge graph,KG)是一種知識庫技術(shù),在上世紀(jì)五六十年代就已萌芽,起源于語義網(wǎng)絡(luò)的知識表現(xiàn)形式。

語義網(wǎng)絡(luò)的本義是,知識由相互連接的節(jié)點和邊組成,節(jié)點表示概念或者對象,邊表示他們之間的關(guān)系。在知識圖譜里,每個節(jié)點表示現(xiàn)實世界中存在的“實體”,每條邊為實體與實體之間的“關(guān)系”。在表現(xiàn)形式上,語義網(wǎng)絡(luò)和知識圖譜相似,但語義網(wǎng)絡(luò)更側(cè)重于描述概念與概念之間的關(guān)系,而知識圖譜則更偏重于描述實體之間的關(guān)聯(lián)。所以,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò),提供從“關(guān)系”的角度去分析問題的能力。

“知識圖譜”這個概念具體什么時候被提出,網(wǎng)上有多種說法,廣為業(yè)內(nèi)認(rèn)可的是2012年,Google首次公開將其應(yīng)用在搜索上,也是自此,知識圖譜成為了研究應(yīng)用的熱點。比如在谷歌上搜索“唐納德川普”,在搜索結(jié)果頁面的右側(cè)會出現(xiàn)與之相關(guān)的身份信息、行為信息、社交信息、關(guān)聯(lián)人等。

知識圖譜:從“數(shù)據(jù)”競爭到“技術(shù)”競爭

二、知識圖譜的基本特性

有了知識圖譜,機器看到的就不再是簡單的字符串,而是可以把這些字符串映射到各種各樣的實體、概念,從而建立機器自己的認(rèn)知世界,更直觀的為場景服務(wù)。

下面簡單梳理一下知識圖譜的基本特性:

  • 網(wǎng)狀知識結(jié)構(gòu)

  • 復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)

  • 網(wǎng)絡(luò)由節(jié)點、邊、以及它們的屬性構(gòu)成

  • 知識庫是知識圖譜承載數(shù)據(jù)的主要方式

也就是說,知識圖譜是由一些相互連接的實體和他們的屬性構(gòu)成的。換句話說,知識圖譜是由一條條知識組成,每條知識表示為一個SPO三元組(Subject-Predicate-Object)。如:(堂吉訶德,作者,塞萬提斯)

常用RDF來形式化地表示這種三元關(guān)系。RDF(Resource Description Framework),即資源描述框架,是W3C制定的,用于描述實體/資源的標(biāo)準(zhǔn)數(shù)據(jù)模型。

知識圖譜的表示方式之一RDF

知識圖譜的表示方式之一RDF

(Semantic similarity analysis and application in knowledge graphs, Ganggao, Zhu, Phd Thesis, 2017)

RDF圖中一共有三種類型,International Resource Identifiers(IRIs),blank nodes 和 literals。現(xiàn)實中,這種呈現(xiàn)方式的典型應(yīng)用有Walfram Alpha知識庫。它是目前世界上包含實體數(shù)最多的知識庫,總量超過10萬億條。


知識圖譜的表示方式之一RDF

?

三、知識圖譜的關(guān)鍵理論和技術(shù)

早期語義網(wǎng)絡(luò)研究如何將數(shù)據(jù)表示成機器和人都可以理解的, 所以核心的研究方向是對元數(shù)據(jù)的研究,即如何描述數(shù)據(jù)。知識圖譜是在語義網(wǎng)基礎(chǔ)上發(fā)展起來的,包含上億的事實和他們之間的關(guān)系。

自然語言處理技術(shù)推動了知識圖譜應(yīng)用,知識圖譜也為自然語言處理提供更廣闊的應(yīng)用空間,所以知識圖譜中的關(guān)鍵理論和技術(shù)涉及到很多自然語言處理。

例如text analysis, document retrieval, entity linking, word sense disambiguation, name entity disambiguation, query interpretation, question answer.

知識圖譜的技術(shù)架構(gòu)

知識圖譜的技術(shù)架構(gòu)
?

(劉嶠 李楊 段宏 劉瑤 秦志光 出版源:《計算機研究與發(fā)展》, 2016, 53 (3):582-600 2

三、知識圖譜主要應(yīng)用場景

知識圖譜最大的優(yōu)勢在于對數(shù)據(jù)的描述能力很強大,機器學(xué)習(xí)、深度學(xué)習(xí)算法雖然在預(yù)測能力上不錯,但在描述能力上卻差強人意,知識圖譜則剛好填補了這部分空白。

雖然知識圖譜是當(dāng)前研究的熱點,但在國內(nèi)尚屬一個比較新的概念,其應(yīng)用也處于初始階段,主要集中在諸如通信、醫(yī)療、互聯(lián)網(wǎng)、金融等對技術(shù)敏感的行業(yè)領(lǐng)域。

下面,我們對已有應(yīng)用做一個簡單介紹:

1、語義搜索

語義搜索的功能類似于知識圖譜在Google, Baidu上的應(yīng)用,通過知識圖譜擴展用戶的搜索關(guān)鍵詞,從而返回更豐富、更全面的信息。

舉個應(yīng)用案例,搜索“價格在10萬以下的白色長安汽車”:


語義搜索

首先是句法分析,通過實體識別,分解搜索需求,如人名、地名、品牌名、顏色等,然后根據(jù)分析結(jié)果,搜索目標(biāo)-汽車,目標(biāo)屬性-白色、長安、價格0-10萬,最后,將這些結(jié)果用圖形網(wǎng)絡(luò)的方式展示,就把復(fù)雜的信息以直觀明了的圖像呈現(xiàn)出來,讓使用者對隱藏信息的來龍去脈一目了然。

2、智能問答

智能問答功能同樣也可以體現(xiàn)在搜索引擎上,通過構(gòu)建龐大的知識庫,訓(xùn)練機器,讀懂人類的需求。

如蘋果Siri、電信客服、銀行智能語音助手、健康助理等。其應(yīng)用過程同語義搜索,只是在表現(xiàn)上還加入了其他技術(shù),如語音識別、圖形識別等。

智能問答

?

3、風(fēng)險控制

現(xiàn)代商業(yè)發(fā)展面臨的風(fēng)險因素日趨復(fù)雜,利用知識圖譜可以構(gòu)建行業(yè)的知識庫,進行風(fēng)險挖掘,從而達(dá)到控制風(fēng)險,管理風(fēng)險的目的,典型應(yīng)用有金融領(lǐng)域的反欺詐和風(fēng)險預(yù)測。

那么,如何構(gòu)建金融知識圖譜?

“金融知識圖譜”是金融行業(yè)知識搜索的基礎(chǔ)技術(shù),是具有語義處理與信息互聯(lián)互通能力的知識庫。構(gòu)建“金融知識圖譜”可以提升金融機構(gòu)反欺詐、風(fēng)險評估、預(yù)測等風(fēng)險管理能力。

構(gòu)建“金融知識圖譜”可分為兩大部分:一是數(shù)據(jù)梳理,基于資金往來,賬戶,抵押物,股權(quán)結(jié)構(gòu),訴訟,聯(lián)系方式等關(guān)系建立企業(yè),人, 事件等實體間的關(guān)系圖譜;二是基于知識圖譜的數(shù)據(jù)挖掘應(yīng)用,例如:擔(dān)保圈分析,可挖掘出循環(huán)擔(dān)保;深度風(fēng)險鏈條分析,揭示多層網(wǎng)絡(luò)中風(fēng)險關(guān)系;客戶群體劃分,可以提取滿足一定條件的客戶用于獲客。

下面以譽存科技應(yīng)用知識圖譜做企業(yè)風(fēng)險評估的項目為例來介紹

風(fēng)險控制
(譽存科技知識圖譜應(yīng)用流程

1、定義需求:落實到具體業(yè)務(wù)問題,提出可視化需求。如風(fēng)險關(guān)系挖掘、失信預(yù)測

2、數(shù)據(jù)收集和預(yù)處理:使用ETL+自然語言處理技術(shù),整合海量結(jié)構(gòu)化數(shù)據(jù)+非結(jié)構(gòu)化數(shù)據(jù)

3、知識圖譜設(shè)計:定義實體,關(guān)系,屬性

4、知識圖譜存儲設(shè)計:Neo4j

5、上層應(yīng)用開發(fā):基于規(guī)則,基于算法


知識圖片應(yīng)用

企業(yè)關(guān)聯(lián)圖譜的展示:主體企業(yè)、關(guān)聯(lián)企業(yè)、董監(jiān)高法等關(guān)聯(lián)人的重要關(guān)系梳理,圖譜化展示。

譽存科技企業(yè)關(guān)聯(lián)網(wǎng)絡(luò)圖
譽存科技企業(yè)關(guān)聯(lián)網(wǎng)絡(luò)圖

(譽存科技企業(yè)關(guān)聯(lián)網(wǎng)絡(luò)圖

基于企業(yè)知識圖譜的企業(yè)風(fēng)險挖掘:基于規(guī)則


基于企業(yè)知識圖譜的企業(yè)風(fēng)險挖掘

(風(fēng)險鏈條展示)

未來風(fēng)險預(yù)測:基于機器學(xué)習(xí)算法或者傳導(dǎo)模型


未來風(fēng)險預(yù)測

基于網(wǎng)絡(luò)風(fēng)險傳導(dǎo)模型的失信風(fēng)險預(yù)測:利用企業(yè)圖譜的拓?fù)浣Y(jié)構(gòu)+啟發(fā)式算法

基于網(wǎng)絡(luò)風(fēng)險傳導(dǎo)模型的失信風(fēng)險預(yù)測

結(jié)語

當(dāng)前,各大互聯(lián)網(wǎng)科技公司都紛紛創(chuàng)建了自己的知識庫。大數(shù)據(jù)和新算法為規(guī)?;R圖譜構(gòu)建提供了新的技術(shù)基礎(chǔ)和發(fā)展條件,使得知識圖譜構(gòu)建的來源、方法和技術(shù)手段都發(fā)生極大的變化。

與數(shù)據(jù)與量化強相關(guān)的金融行業(yè),對知識圖譜技術(shù)更是抱著開放、歡迎的態(tài)度。許多思想領(lǐng)先,對技術(shù)敏感的金融機構(gòu),通過積極與金融科技公司合作,已成功將知識圖譜運用于反欺詐、智能推薦、智能風(fēng)控、營銷獲客等方面,搶先獲得了技術(shù)賦能的優(yōu)勢與價值。未來,在金融領(lǐng)域,從精準(zhǔn)營銷、風(fēng)險預(yù)測到用戶決策,知識圖譜的底層支撐性作用將越來越顯著。

國內(nèi)領(lǐng)先的數(shù)字科技企業(yè)
聯(lián)系我們