首页

基于Hadoop的并行实体解析方法研究与应用 07月07日

【摘要】实体解析用于判断两个数据记录是否描述的是现实世界中的同一实体对象。它对于数据集成、数据清洗、数据去重和处理优化都十分重要。实体解析所处理的对象不仅局限于数据记录,还包括在文本文件比对、文档查重、人脸图像识别、指纹识别等一些具有特定解析需求的实际应用中。从参与实体解析的主体角度来看,可以将实体解析的方法分为两大类,即基于机器算法的实体解析和基于人工的实体解析。纯粹的机器算法解析虽然可以获得较 […]