北京人才地圖來了!北京成全國最頂尖人才聚集高點
北京是世界著名的歷史文化古都和現(xiàn)代化國際大都市,同時,北京也是全國最頂尖人才聚集的高點。
科技人才是國家科技創(chuàng)新經(jīng)濟發(fā)展的首要驅(qū)動力,也是實現(xiàn)中華民族偉大復(fù)興的關(guān)鍵因素。如何發(fā)現(xiàn)、培養(yǎng)、留住、吸引、使用人才,是在當(dāng)今日趨嚴(yán)峻的國際競爭中取得優(yōu)勢的重要課題。
眾所周知,過去三十年,作為經(jīng)濟、政治中心的北京集聚了全國乃至全球各地優(yōu)質(zhì)學(xué)者人才,不斷推動著北京綜合實力和核心競爭力的增長。
今天,學(xué)術(shù)君就帶領(lǐng)大家一起通過 AI+大數(shù)據(jù),詳細(xì)了解一下北京的人才現(xiàn)狀和實力。
通過北京市智慧人才地圖(圖1)可以看出,北京市人才整體分布與發(fā)展情況上,遙遙領(lǐng)先于全國其它重點城市。
圖1:北京市智慧人才地圖
具體而言,北京市云計算、人工智能、大數(shù)據(jù)和物聯(lián)網(wǎng)四個領(lǐng)域的高層次人才總數(shù)為 2995 人(四個領(lǐng)域高影響力期刊中近 10 年發(fā)文的學(xué)者數(shù)量),遠(yuǎn)超其它一線城市。
其中,云計算領(lǐng)域的高層次人才凝聚數(shù)量最多,為 878 人(該領(lǐng)域高影響力期刊中近 10 年發(fā)文的學(xué)者數(shù)量,下同);人工智能領(lǐng)域的高層次人才聚集數(shù)量為 845 人;大數(shù)據(jù)領(lǐng)域的高層次人才聚集數(shù)量為 679 人;物聯(lián)網(wǎng)領(lǐng)域的高層次人才數(shù)量為 593 人。
此外,從圖1可以看出,北京市 92% 的重點領(lǐng)域高層次人才集中在海淀區(qū),從所屬高校/機構(gòu)來看,清華大學(xué)、北京大學(xué)和北京郵電大學(xué)占據(jù)北京人才機構(gòu)排名前三。
分領(lǐng)域來看,在人工智能領(lǐng)域(圖2),北京市的人才健康指數(shù)為 92.8,在全國排行第一。
圖2:北京市人工智能領(lǐng)域人才指數(shù)
其中,地區(qū)影響力對比中,北京市與其它城市相比,在產(chǎn)業(yè)創(chuàng)新研究和產(chǎn)業(yè)創(chuàng)新影響力上較為突出;從分布區(qū)域上看,人工智能領(lǐng)域人才主要集中在海淀區(qū),清華大學(xué)和北京大學(xué)在該領(lǐng)域人才數(shù)量最多、成果數(shù)量最大;“機器學(xué)習(xí)”“無監(jiān)督學(xué)習(xí)”“語音識別”等關(guān)鍵詞是該城市該領(lǐng)域的科研熱點。
在大數(shù)據(jù)領(lǐng)域(圖3),北京市的人才健康指數(shù)為 95.2,在全國排名第一。
圖3:北京市大數(shù)據(jù)領(lǐng)域人才指數(shù)
其中,從區(qū)域分布上看,北京市的大數(shù)據(jù)領(lǐng)域人才主要集中在海淀區(qū)與朝陽區(qū);在大數(shù)據(jù)領(lǐng)域的人才機構(gòu)排名中,清華大學(xué)和北京大學(xué)同樣領(lǐng)跑一眾機構(gòu);“數(shù)據(jù)庫”“數(shù)據(jù)流”“數(shù)據(jù)立方體”等關(guān)鍵詞揭示了北京市大數(shù)據(jù)領(lǐng)域的研究熱點。
在云計算領(lǐng)域(圖4),北京市的人才健康指數(shù)為 90.2,在全國排名第一。
圖4:北京市云計算領(lǐng)域人才指數(shù)
其中,地區(qū)影響力對比中,北京市在產(chǎn)業(yè)創(chuàng)新影響力上較為突出,而基礎(chǔ)科研影響力方面相對弱一些(但強于其它城市);從區(qū)域分布上看,北京市的云計算領(lǐng)域人才主要集中在海淀區(qū);在大數(shù)據(jù)領(lǐng)域的人才機構(gòu)排名中,清華大學(xué)在該領(lǐng)域人才數(shù)量最多、成果數(shù)量最大;“P2P 分布式”“虛擬桌面”“企業(yè)混合云”等詞是該城市該領(lǐng)域的研究熱點。
在物聯(lián)網(wǎng)領(lǐng)域(圖5),北京市的人才健康指數(shù)為 91.3,在全國排名第一。
圖5:北京市物聯(lián)網(wǎng)領(lǐng)域人才指數(shù)
其中,地區(qū)影響力對比中,北京市在產(chǎn)業(yè)創(chuàng)新影響力和產(chǎn)業(yè)創(chuàng)新上較為突出;從區(qū)域分布上看,人才主要集中在海淀區(qū)和朝陽區(qū);在該領(lǐng)域的人才機構(gòu)排名中,清華大學(xué)、北京大學(xué)和北京郵電大學(xué)名列前茅;“無線通信”“商業(yè)智能”“傳感器”等詞是該城市該領(lǐng)域的研究熱點。
人才地圖的智慧之處
《智慧人才地圖》是智譜·AI 借助科技情報大數(shù)據(jù)挖掘與服務(wù)系統(tǒng)平臺 AMiner,構(gòu)建的超大規(guī)模多研究領(lǐng)域知識圖譜,基于場景提供學(xué)者的智能匹配服務(wù)的智慧人才系統(tǒng)。
系統(tǒng)利用數(shù)據(jù)挖掘和社會網(wǎng)絡(luò)分析技術(shù),從海量文獻(xiàn)及互聯(lián)網(wǎng)信息中獲取信息并進行語義抽取和隱含關(guān)聯(lián)關(guān)系挖掘,構(gòu)建全球全領(lǐng)域?qū)W者庫人才網(wǎng)絡(luò),為學(xué)者、機構(gòu)、企業(yè)等提供人才搜索、論文搜索、學(xué)者社會網(wǎng)絡(luò)關(guān)系識別、學(xué)者能力圖譜等多樣化功能。
而且,智慧人才系統(tǒng)提供基于大規(guī)模知識圖譜的人才語義檢索,智能理解用戶查詢的語義信息,自動從學(xué)科領(lǐng)域、人才姓名、研究興趣、就職單位等多個維度對系統(tǒng)提供的專家智庫進行快速而準(zhǔn)確地檢索,準(zhǔn)確定位用戶尋找的專家人才,并提供多維度人才語義屬性的快速過濾和智能排序。
除了自能的語義檢索外,產(chǎn)品還為用戶提供了專家/智庫的收藏,以及對開通智庫的瀏覽,從不同功能入口幫助用戶快速找到目標(biāo)專家。
智慧人才系統(tǒng)的亮點包括:
以大數(shù)據(jù)技術(shù)為核心,構(gòu)建超大規(guī)模多研究領(lǐng)域知識圖譜,基于場景提供學(xué)者的智能匹配服務(wù);提取基于各地區(qū)、研究領(lǐng)域的人才指標(biāo),對人才結(jié)構(gòu)、發(fā)展目標(biāo)等多維度進行分析和預(yù)測,提供對人才數(shù)據(jù)的可視化展示,實現(xiàn)對學(xué)者的「按圖索驥」;產(chǎn)品采用 SaaS 模式下的微服務(wù)架構(gòu),可對于業(yè)務(wù)需求的變更進行快速響應(yīng)和快速部署,實現(xiàn)對業(yè)務(wù)擴展的及時支持。
正如前文展示,智慧人才地圖能夠給出北京市人工智能、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)等等熱點領(lǐng)域的多方面信息。所呈現(xiàn)的數(shù)據(jù)點面結(jié)合,既包括北京該領(lǐng)域的人才動態(tài)、城市人才分布、北京人才機構(gòu)排名,也有該領(lǐng)域的全國人才分布、全國發(fā)展情況以及北京與全國其他省會城市的影響力對比。
圖:智慧人才地圖“人才健康指數(shù)”和“人才分布地圖”功能介紹
圖:智慧人才地圖“本地人才核心領(lǐng)域/行業(yè)”和“人才動態(tài)”功能介紹
圖 :智慧人才地圖“人才態(tài)勢分析”功能介紹
此外,科技情報大數(shù)據(jù)挖掘與服務(wù)系統(tǒng)平臺 AMiner 還結(jié)合人工智能學(xué)術(shù)知識圖譜,深度挖掘了目前北京各個領(lǐng)域?qū)W者的職業(yè)生涯信息。
感興趣的讀者可以訪問 AMiner 平臺進行查看。
智慧人才系統(tǒng)算法解析
那么,這么詳細(xì)、可視化的人才地圖,是怎么做出來的呢?
智譜AI人才地圖的研發(fā)團隊表示,該智慧人才系統(tǒng)依托清華大學(xué)高質(zhì)量大規(guī)模知識圖譜、深度隱含關(guān)聯(lián)挖掘算法和認(rèn)知圖譜等核心技術(shù),服務(wù)地方科技產(chǎn)業(yè)發(fā)展,展示符合地方發(fā)展方向的本地、全國和全球人才分布態(tài)勢、人才流動趨勢,可以為地方人才引進工作中的尋、評、引、用提供基于大數(shù)據(jù)的智能化支持,構(gòu)建全球人才 Global Positioning System,實現(xiàn)人才工作的按圖索驥。
在算法使用上,智慧人才地圖主要使用了人才指數(shù)算法和兩種城市人才分析方法。
人才指數(shù)算法:
該算法模型是一種機器學(xué)習(xí)+專家經(jīng)驗的集成模型,內(nèi)層根據(jù)學(xué)術(shù)人才評價指標(biāo)特點分別采用使用 LR,SVM,深度神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)算法。利用 AMiner 人工標(biāo)注的不同領(lǐng)域、多層次學(xué)術(shù)機構(gòu)的大量高質(zhì)量學(xué)者數(shù)據(jù)庫作為模型訓(xùn)練數(shù)據(jù)。在此基礎(chǔ)上,外層封裝專家知識的經(jīng)驗?zāi)P停M合而成城市人才評分模型。
為使該算法達(dá)到最優(yōu)計算效果,該模型的訓(xùn)練采用了啟發(fā)式規(guī)則+模型自主學(xué)習(xí)的聯(lián)合算法,優(yōu)化目標(biāo)值也是從大量經(jīng)過提純的學(xué)者數(shù)據(jù)中,經(jīng)過統(tǒng)計分析得到的。
這樣得到的算法模型,結(jié)合了大數(shù)據(jù)分析和專家先驗知識,從而達(dá)到合理精準(zhǔn)評分。
而計算城市人才指數(shù)得分的過程,就是將人才該城市的人才指標(biāo)特征(頂尖學(xué)者發(fā)文數(shù)之和,學(xué)者數(shù),h之和,引用數(shù)之和等),輸入到模型中,會得到所屬的層級分類和具體得分,這個得分可以理解為和高等級的學(xué)術(shù)團體之間的差距。
城市人才分析方法:
針對需求領(lǐng)域類型的不同分別采用以下2種方法:
1.針對較為專業(yè)的領(lǐng)域方向,且和其他領(lǐng)域交叉較多,采用學(xué)者標(biāo)注算法進行人才分析;使用2類算法對學(xué)者進行領(lǐng)域分析標(biāo)注:
a. AMiner 學(xué)科知識圖譜:對學(xué)者的發(fā)表論文中的實體,關(guān)系等信息進行抽取(其中實體抽取方法使用 BERT+CRF 和規(guī)則,關(guān)系抽取采用多種方式結(jié)合:包括規(guī)則和遠(yuǎn)程監(jiān)督),再利用已構(gòu)建的學(xué)科知識圖譜推理對學(xué)者進行領(lǐng)域標(biāo)注。
b. 領(lǐng)域標(biāo)注系統(tǒng):這是一個以深度學(xué)習(xí)為核心算法的多標(biāo)簽標(biāo)注系統(tǒng),算法網(wǎng)絡(luò)結(jié)構(gòu)簡單說明:先用 bert 對學(xué)者多篇代表性論文進行 Emmbedding,再使用多個的局部 Attention 層和全局 Attention 層進行特征的融合和提取,最后基于這些語義特征向量進行標(biāo)簽預(yù)測,即對學(xué)者進行領(lǐng)域的標(biāo)注。
2.針對于相對獨立的學(xué)科領(lǐng)域采用 AMiner 會議期刊庫(包含大約 4 萬個期刊會議)進行人才篩選分析;流程如下:專家標(biāo)注期刊/會議→期刊/會議影響力排序→學(xué)者篩選→學(xué)者學(xué)術(shù)水平排序。
參考資料:智譜.AI 智慧人才地圖

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?