首页

词的内部结构分析 06月30日

【摘要】词法分析是自然语言处理中最基础、最关键的步骤。在中文信息处理领域,词法分析的一般做法是通过分词给词和短语划定边界,从而使汉语的后续处理过程跟英语等西方语言基本一致。然而,汉语中词与短语之间的界限比较模糊,许多情况下,某些语言单位就连语言学家也很难确定是语素、词还是短语。这导致实践中人工标注的分词语料存在严重的不一致性,而这种不一致性无疑会制约汉语的后续处理工作。分词语料的不一致性不仅体现在 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于实例的维汉机器翻译若干关键问题研究 10月27日

【摘要】机器翻译是目前人工智能中最活跃的研究领域之一。近年来基于语料库的机器翻译方法越来越成为研究的热点。作为基于语料库机器翻译分支之一的基于实例的机器翻译(EBMT)因较经济、建立快等特点,赢得了研究者的兴趣,对其研究具有重要的理论意义和使用价值。维吾尔语信息处理研究起步较晚,虽然目前很多研究人员在维吾尔语信息处理做了不少工作,但其基础性研究的成果和可利用工具等还是非常有限。维吾尔语作为典型的粘 […]