基于依存关系树的复句句法特征自动选取 07月24日
【摘要】随着社会的发展,科技的进步,人们获取信息的途径越来越多,而且更加方便。人们在交流的过程中,也产生了大量的数据。信息处理的自动化和智能化是社会发展的必然。在此背景下,自然语言处理领域得到了飞速发展。在中文信息处理领域,分词和词性标注已经取得突破性进展。然而,为了最终实现对篇章的理解,要上升到句子层面的理解,而中文复句的研究是句子到篇章研究的过渡。复句由分句构成,其所含的信息量比单句大,常用来 […]
藏语分词与词性标注研究 11月16日
【摘要】藏语信息处理技术经过二十多年的发展,无论是在藏文信息处理研究及其相关标准制定方面,还是在藏语信息处理应用开发方面,都取得了不少成绩。藏语信息处理技术也逐步迈入到语言信息处理层面。虽然藏语信息处理研究在技术上紧跟着英汉语等之后,但作为信息处理研究基础的语料资源相对贫乏。公开的藏语语料库都是未标注的生语料库,其应用价值非常有限。由于对藏语的本体研究不够深入,许多对藏语信息处理有价值的属性未能挖 […]