- +1
北大發(fā)布“中華民族語(yǔ)言文字接觸交融大數(shù)據(jù)模型”

活動(dòng)中,孔江平介紹北大語(yǔ)言學(xué)實(shí)驗(yàn)室相關(guān)研究成果。澎湃新聞?dòng)浾?程婷 圖
12月16日—19日,北京大學(xué)舉行北京大學(xué)語(yǔ)言學(xué)實(shí)驗(yàn)室成立一百周年系列活動(dòng)?;顒?dòng)中,“中華民族語(yǔ)言文字接觸交融大數(shù)據(jù)模型”成果發(fā)布。
據(jù)北大語(yǔ)言學(xué)實(shí)驗(yàn)室主任、北大中文系教授孔江平介紹,北大語(yǔ)言學(xué)實(shí)驗(yàn)室是集科研、教學(xué)、社會(huì)服務(wù)于一體的多學(xué)科交叉平臺(tái),其前身是1925年成立的北大語(yǔ)音樂(lè)律實(shí)驗(yàn)室。2021年12月,北大語(yǔ)言學(xué)實(shí)驗(yàn)室獲批為教育部哲學(xué)社會(huì)科學(xué)實(shí)驗(yàn)室。在教育部經(jīng)費(fèi)的支持下,2022年春北大語(yǔ)言學(xué)實(shí)驗(yàn)室啟動(dòng)了“中華民族語(yǔ)言文字接觸交融大數(shù)據(jù)模型建設(shè)”項(xiàng)目。該項(xiàng)目組織國(guó)內(nèi)12所大學(xué)和科研機(jī)構(gòu)的約20名專家的研究團(tuán)隊(duì),近200名博士生和碩士生,對(duì)中華民族語(yǔ)言文字接觸交融情況進(jìn)行了大規(guī)模的田野調(diào)查,歷經(jīng)四年,初步完成了基礎(chǔ)的調(diào)查工作和大型數(shù)據(jù)庫(kù)建設(shè)。
此次發(fā)布的中華民族語(yǔ)言文字接觸交融大數(shù)據(jù)模型,涉及中華民族語(yǔ)言文字接觸交融大數(shù)據(jù)模型數(shù)據(jù)庫(kù)的結(jié)構(gòu);語(yǔ)言活力的基礎(chǔ)模型和算法——主要討論語(yǔ)言活力的基本要素和分類方法;文字活力的基礎(chǔ)模型和算法——主要討論語(yǔ)言活力的基本要素和分類方法;中華民族語(yǔ)言文字接觸交融大數(shù)據(jù)模型的內(nèi)容和形式——主要討論數(shù)據(jù)庫(kù)的形式;中華民族語(yǔ)言文字接觸交融通用語(yǔ)言詞匯模型與算法——主要討論詞匯的語(yǔ)意結(jié)構(gòu)、相關(guān)的基本算法和分類的方法;中華民族語(yǔ)言文字接觸交融音位系統(tǒng)相似度模型與算法——主要討論利用音位系統(tǒng)相似性來(lái)對(duì)語(yǔ)言進(jìn)行分類。該大模型的建設(shè),有助于讓沉睡在田野中的即將消亡的聲音活起來(lái)、傳承下去。
孔江平介紹,在該項(xiàng)目中,除了大數(shù)據(jù)模型以外,主要成果還有關(guān)于中華民族語(yǔ)言文字接觸交融的系列書籍。按語(yǔ)言接觸和融合的實(shí)際,該系列書籍共分為十七卷,將于明年陸續(xù)出版。
此外,北大語(yǔ)言學(xué)實(shí)驗(yàn)室還在“人類語(yǔ)言涌現(xiàn)和演化研究”“語(yǔ)言障礙與教育公平研究”和“基于人工智能的語(yǔ)言應(yīng)用研究”等方向上開展了多項(xiàng)重大課題的研究。本次活動(dòng)期間,有聲博物館項(xiàng)目建設(shè)同步啟動(dòng)。
北大黨委副書記姜國(guó)華表示,北大語(yǔ)言學(xué)實(shí)驗(yàn)室是文理學(xué)科交叉創(chuàng)新的典范,希望實(shí)驗(yàn)室繼續(xù)傳承科學(xué)方法傳統(tǒng),主動(dòng)服務(wù)國(guó)家戰(zhàn)略,做文明火種的守護(hù)者、交叉創(chuàng)新的開拓者、立德樹人的踐行者和中國(guó)學(xué)派的建構(gòu)者。
教育部語(yǔ)言文字應(yīng)用管理司司長(zhǎng)楊鴻表示,北大語(yǔ)言學(xué)實(shí)驗(yàn)室積極服務(wù)國(guó)家語(yǔ)言文字重大戰(zhàn)略任務(wù)與需求。他希望北大繼續(xù)以中文系和語(yǔ)言學(xué)實(shí)驗(yàn)室為重要陣地,進(jìn)一步深耕國(guó)家通用語(yǔ)言文字推廣普及、引領(lǐng)語(yǔ)言文字?jǐn)?shù)智變革、厚植復(fù)合型人才沃土,為構(gòu)建新時(shí)代語(yǔ)言文字事業(yè)高質(zhì)量發(fā)展體系作出更大貢獻(xiàn)。
教育部語(yǔ)言文字信息管理司司長(zhǎng)劉培俊表示,在智能時(shí)代,語(yǔ)言文字已成為大語(yǔ)言模型以及人工智能技術(shù)創(chuàng)新的數(shù)據(jù)要素、智能基座和戰(zhàn)略基礎(chǔ)。期待北大語(yǔ)言學(xué)實(shí)驗(yàn)室未來(lái)在國(guó)家標(biāo)準(zhǔn)研制、關(guān)鍵技術(shù)攻關(guān)、跨學(xué)科協(xié)同等方面發(fā)揮更大作用,有效賦能經(jīng)濟(jì)社會(huì)發(fā)展。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




