全國政協(xié)委員、院士陳松蹊:建議有序開放共享公共數(shù)據(jù)
“盡快優(yōu)化有關(guān)政策,實(shí)現(xiàn)公共數(shù)據(jù)的開放共享,從而促進(jìn)非公共機(jī)構(gòu)的數(shù)據(jù)流動(dòng)和價(jià)值創(chuàng)造,引導(dǎo)中國數(shù)據(jù)要素市場的建立和良性循環(huán)。”2024全國兩會(huì)即將召開前夕,第十四屆全國政協(xié)委員、中國科學(xué)院院士陳松蹊在接受財(cái)聯(lián)社專訪時(shí)建議。
作為數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家,陳松蹊對(duì)數(shù)據(jù)要素領(lǐng)域有深入的探索,對(duì)數(shù)據(jù)領(lǐng)域的科研和應(yīng)用方面的痛點(diǎn)難點(diǎn)有著深刻的理解。今年全國兩會(huì)期間,關(guān)于數(shù)據(jù)方面,陳松蹊委員帶來了關(guān)于“共享公共數(shù)據(jù) 實(shí)現(xiàn)科學(xué)數(shù)據(jù)自立自強(qiáng)”和“加強(qiáng)數(shù)據(jù)分析人才培養(yǎng)力度”兩份提案。為此,財(cái)聯(lián)社結(jié)合數(shù)據(jù)要素相關(guān)問題對(duì)陳松蹊委員進(jìn)行專訪。
有序開放共享公共數(shù)據(jù)
財(cái)聯(lián)社:目前數(shù)據(jù)要素行業(yè)存在哪些問題?對(duì)產(chǎn)業(yè)發(fā)展造成了哪些影響?
陳松蹊:首先,我國公共數(shù)據(jù)獲取渠道不暢。近十年來,我國一些公共數(shù)據(jù)的可獲取性得到了提升,一些數(shù)據(jù)的實(shí)時(shí)播報(bào)為通過網(wǎng)絡(luò)實(shí)時(shí)下載數(shù)據(jù)提供了可能。但是網(wǎng)絡(luò)下載數(shù)據(jù)的通道并不穩(wěn)定,數(shù)據(jù)發(fā)布格式時(shí)有變化,易造成數(shù)據(jù)缺失。一般科技工作者仍缺乏國內(nèi)歷史公共數(shù)據(jù)的有效獲取途徑,而提供公開的數(shù)據(jù)來源是科研發(fā)表的基本要求。
其次,科學(xué)研究過度依賴國外公共數(shù)據(jù)集。由于國內(nèi)公共數(shù)據(jù)獲取困難,中國科學(xué)家大量使用國外的公開數(shù)據(jù)集進(jìn)行科學(xué)研究。經(jīng)常使用的數(shù)據(jù)集有英國生物銀行基于大樣本人群的遺傳、生活環(huán)境和健康數(shù)據(jù);歐洲中期天氣預(yù)報(bào)中心發(fā)布的自 1951 年的高分辨率全球氣象再分析數(shù)據(jù);美、歐、日本等機(jī)構(gòu)發(fā)布的涵蓋大氣污染物、二氧化碳、沙塵、燈光等高分辨衛(wèi)星數(shù)據(jù);世界衛(wèi)生組織發(fā)布的各國流行病數(shù)據(jù)等。過度依賴外部數(shù)據(jù),不利于我國科學(xué)技術(shù)自立自強(qiáng),可能會(huì)限制研究人員的自主性和創(chuàng)新性;不利于掌握科技資源的主動(dòng)權(quán),存在關(guān)鍵時(shí)刻數(shù)據(jù)獲取中斷的風(fēng)險(xiǎn);也不利于我國科技工作者講好中國故事。
最后,中國目前尤為缺乏高質(zhì)量的再分析科學(xué)數(shù)據(jù)集。再分析數(shù)據(jù)是融合機(jī)理模型和觀察數(shù)據(jù)的高質(zhì)量數(shù)據(jù)集,能有效填補(bǔ)缺失數(shù)據(jù)、降低原始數(shù)據(jù)的噪音,是人工智能算法訓(xùn)練和一般科學(xué)研究的基礎(chǔ)。例如,華為盤古氣象大模型就是基于歐洲氣象中心公開的再分析數(shù)據(jù)集訓(xùn)練的。
財(cái)聯(lián)社:高質(zhì)量再分析科學(xué)數(shù)據(jù)集的短缺一定程度上限制了人工智能技術(shù)的發(fā)展進(jìn)程,為解決相關(guān)問題,你有哪些建議?
陳松蹊:要集中力量打造高質(zhì)量再分析數(shù)據(jù)集,建議組建由領(lǐng)域與數(shù)據(jù)科學(xué)家組成的數(shù)據(jù)融合團(tuán)隊(duì),發(fā)揮我國在數(shù)據(jù)同化方面的統(tǒng)計(jì)學(xué)基礎(chǔ)優(yōu)勢,在一些關(guān)鍵科學(xué)領(lǐng)域構(gòu)建高質(zhì)量的再分析數(shù)據(jù)集,解決我國科研人員的數(shù)據(jù)需求,降低對(duì)外部數(shù)據(jù)的依賴,實(shí)現(xiàn)科學(xué)數(shù)據(jù)自立自強(qiáng)。
財(cái)聯(lián)社:公共數(shù)據(jù)的開放對(duì)于促進(jìn)素具要素市場的建立具有重大意義,然而數(shù)據(jù)安全、隱私等問題也不容忽視,如何做到對(duì)公共數(shù)據(jù)安全合理的開放?
陳松蹊:建議按照數(shù)據(jù)風(fēng)險(xiǎn)等級(jí),有序開放共享公共數(shù)據(jù),使國內(nèi)科研人員、企業(yè)及時(shí)獲取長時(shí)期歷史數(shù)據(jù),提高我國大數(shù)據(jù)分析和數(shù)據(jù)賦能能力。我們建議,高分辨率氣象、大氣、環(huán)保、生態(tài)、經(jīng)濟(jì)社會(huì)等不涉及國家安全的數(shù)據(jù)應(yīng)優(yōu)先考慮公開。對(duì)一些敏感數(shù)據(jù),可以簽署標(biāo)準(zhǔn)化協(xié)議,對(duì)數(shù)據(jù)的使用進(jìn)行不同程度的規(guī)范,之后再對(duì)國內(nèi)學(xué)者和企業(yè)開放。
數(shù)據(jù)分析人才培養(yǎng)能力嚴(yán)重不足財(cái)聯(lián)社:今年你帶來了《加強(qiáng)數(shù)據(jù)分析人才培養(yǎng)力度》提案,在你看來,中國數(shù)據(jù)分析人才短缺的原因主要有哪些?
陳松蹊:中國數(shù)據(jù)分析人才培養(yǎng)能力嚴(yán)重不足,主要體現(xiàn)在四個(gè)方面: 第一,統(tǒng)計(jì)學(xué)在數(shù)據(jù)分析人才培養(yǎng)主力軍作用未得到充分發(fā)揮。在全國120多個(gè)一級(jí)學(xué)科中,統(tǒng)計(jì)學(xué)是僅有的把數(shù)據(jù)作為唯一研究對(duì)象的學(xué)科,是數(shù)據(jù)分析人才培養(yǎng)的核心主干學(xué)科。但受到學(xué)位點(diǎn)數(shù)量和招生名額的限制,我國統(tǒng)計(jì)學(xué)碩士及博士研究生的培養(yǎng)規(guī)模還十分有限,這不利于我國數(shù)據(jù)分析的高層次專業(yè)人才培養(yǎng)和我國東中西部數(shù)據(jù)分析人才的均衡發(fā)展。
第二,統(tǒng)計(jì)學(xué)未被列入基礎(chǔ)學(xué)科。這不利于吸引優(yōu)秀高中生選擇統(tǒng)計(jì)學(xué)專業(yè),不利于國家的人工智能核心技術(shù)的創(chuàng)新發(fā)展,特別是大語言模型、生成式 AI 領(lǐng)域等方面。也不利于培養(yǎng)能引領(lǐng)數(shù)據(jù)分析國際發(fā)展的戰(zhàn)略科學(xué)家,不利于培養(yǎng)能帶領(lǐng)企業(yè)創(chuàng)新發(fā)展、實(shí)現(xiàn)數(shù)據(jù)賦能的數(shù)據(jù)分析師。
第三,師資嚴(yán)重短缺。為了更好地培養(yǎng)數(shù)據(jù)分析人才,高校需要大量的統(tǒng)計(jì)與數(shù)據(jù)科學(xué)師資。從近10年統(tǒng)計(jì)學(xué)博士生的就業(yè)市場看,業(yè)界和學(xué)界對(duì)統(tǒng)計(jì)學(xué)博士畢業(yè)生的需求旺盛,業(yè)界的薪酬待遇相對(duì)較高,一半以上的博士畢業(yè)生選擇在業(yè)界就業(yè),進(jìn)一步加劇了高校數(shù)據(jù)分析人才培養(yǎng)能力不足。我們需要加大高校統(tǒng)計(jì)學(xué)科建設(shè),以滿足學(xué)界和業(yè)界對(duì)統(tǒng)計(jì)學(xué)人才的需求。
第四,政府部門缺乏統(tǒng)計(jì)與數(shù)據(jù)分析高級(jí)專業(yè)人才。政府部門在數(shù)字中國建設(shè)中發(fā)揮著重要作用,而國家和地方統(tǒng)計(jì)局及調(diào)查總隊(duì)、政府部門的統(tǒng)計(jì)專業(yè)機(jī)構(gòu)、醫(yī)療衛(wèi)生行業(yè)等均嚴(yán)重缺乏高層次專業(yè)統(tǒng)計(jì)分析人才,這非常不利于數(shù)字中國和數(shù)字政府建設(shè)。
財(cái)聯(lián)社:中國數(shù)據(jù)分析人才仍存在較大缺口。據(jù)人力資源和社會(huì)保障部估計(jì),預(yù)計(jì)十四五期間需求總量將達(dá)到2000萬人左右,對(duì)此,你有哪些看法和建議?
陳松蹊:無論政府部門還是企業(yè)都需要建立用數(shù)據(jù)說話、決策、管理、創(chuàng)新、賦能的數(shù)據(jù)文化。企業(yè)構(gòu)建數(shù)據(jù)文化需要有數(shù)據(jù)科學(xué)團(tuán)隊(duì),提供從數(shù)據(jù)采集、分析、到管理決策的全流程服務(wù),讓統(tǒng)計(jì)師、數(shù)據(jù)分析師從始至終介入數(shù)據(jù)價(jià)值挖掘。數(shù)據(jù)分析人才是數(shù)據(jù)文化建設(shè)的主力軍,構(gòu)建企業(yè)數(shù)據(jù)文化必須從加強(qiáng)數(shù)據(jù)分析人才培養(yǎng)入手。
因此,建議盡快優(yōu)化有關(guān)政策,切實(shí)加強(qiáng)我國數(shù)據(jù)分析人才培養(yǎng)的能力基礎(chǔ),夯實(shí)數(shù)字中國建設(shè)所需要的人才根基。具體可以從以下三個(gè)方面入手:
第一,盡快將統(tǒng)計(jì)學(xué)納入“強(qiáng)基計(jì)劃”和“基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng)計(jì)劃” 。一是明確將統(tǒng)計(jì)學(xué)納入現(xiàn)有強(qiáng)基計(jì)劃試點(diǎn)高校強(qiáng)基招生專業(yè)中,加大對(duì)統(tǒng)計(jì)學(xué)基礎(chǔ)研究人才培養(yǎng)的支持力度;二是明確將統(tǒng)計(jì)學(xué)納入“基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng)計(jì)劃”,盡快在全國高校中遴選補(bǔ)充一批統(tǒng)計(jì)學(xué)基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng)基地,補(bǔ)齊統(tǒng)計(jì)學(xué)基礎(chǔ)研究創(chuàng)新拔尖人才培養(yǎng)短板。
第二,加強(qiáng)統(tǒng)計(jì)與數(shù)據(jù)科學(xué)課程體系與教材體系建設(shè)。為了培養(yǎng)高水平數(shù)據(jù)分析人才,將統(tǒng)計(jì)學(xué)納入國家“101 計(jì)劃”,集中全國優(yōu)勢力量,系統(tǒng)性建設(shè)統(tǒng)計(jì)學(xué)教材體系,加快形成適應(yīng)數(shù)字中國建設(shè)的統(tǒng)計(jì)與數(shù)據(jù)科學(xué)核心課程體系,并在全國高校中逐步推廣。
第三,加大統(tǒng)計(jì)學(xué)一流學(xué)科建設(shè)的支持力度。一是增加統(tǒng)計(jì)學(xué)雙一流建設(shè)學(xué)科點(diǎn);二是在經(jīng)費(fèi)投入、招生名額、推免比例、長江學(xué)者和教學(xué)名師評(píng)審等方面給予統(tǒng)計(jì)學(xué)以其他基礎(chǔ)學(xué)科同樣的政策傾斜;三是布局建設(shè)若干統(tǒng)計(jì)學(xué)前沿科學(xué)中心、教育部重點(diǎn)實(shí)驗(yàn)室。