首页

基于词语热度的启发式中文句子压缩 11月07日

【摘要】目前文本压缩是一门很有前景的技术,句子压缩又是文本压缩的核心部分,因此研究句子压缩是很有意义的。句子压缩技术在保留句中主题信息的基础上缩短句子的长度,便于读者获取其中最重要信息。现有句子压缩方法分为两类:基于规则的方法和基于统计的方法。然而已有的基于规则的方法大多只适用于英文句子的压缩,不能移植到中文句子压缩中;基于统计的方法又依赖于“原句-压缩句”的对齐语料库,中文的对齐语料库难以获得, […]