首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 計算機軟件及計算機應(yīng)用 > 中文信息學(xué)報 > 基于主述位理論的漢語基本篇章單元識別 【正文】
摘要:基本篇章單元(Elementary Discourse Units,EDU)識別對篇章分析工作意義重大,是構(gòu)建篇章結(jié)構(gòu)的基礎(chǔ)。從篇章銜接性視角看,每個EDU都由要表達信息的起始點--主位和要傳達的新信息--述位兩部分構(gòu)成。該文結(jié)合已有研究和漢語實際情況,給出了一個基于主述位理論的漢語基本篇章單元識別方法。該方法將EDU識別轉(zhuǎn)化為主述位識別問題,由主位、述位的位置間接地確定EDU的邊界,最終完成EDU的識別。而主、述位間具有明顯的信息序列化特征,因此可通過序列化標注方法進行。基于主述位理論的漢語基本篇章單元識別方法更關(guān)注EDU作為一個獨立的篇章單元的內(nèi)部構(gòu)成,在漢語篇章話題結(jié)構(gòu)語料庫CDTC上的實驗也進一步驗證了該方法的有效性,EDU識別的性能F1值達到了89.46%。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:中國科學(xué)技術(shù)協(xié)會;主辦單位:中國中文信息學(xué)會;中國科學(xué)院軟件研究所
一對一咨詢服務(wù)、簡單快捷、省時省力
了解更多 >直郵到家、實時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進度實時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >