北京祥龙博瑞汽车服务(集团)有限公司拟实施车辆保单自动录入功能的开发项目,因项目中包含部分关键技术需求模型的开发,现公开征集技术开发意向合作伙伴,并根据报名情况进行具体的需求及技术沟通,后续将根据我公司的采购流程履行相关采购手续。
一、征集范围:在京高校、科研院所
二、发布日期:2024年9月23日
三、具体功能需求如下:
(一)完成车辆PDF保单的关键数据识别(调用第三方OCR识别工具)。
(二)调用底盘号数据(VIN号),获取第三方数据接口中的车辆相关维度数据。(可调用第三方接口)。
(三)根据获取的保单文本数据、车辆数据(简称目标数据)与集团业务管理系统中的主数据进行匹配。(此功能中包含关键技术需求:复杂场景中车辆与客户数据匹配优化算法)。
(四)根据算法匹配逻辑自动判断目标数据在集团业务管理系统中的最优主数据记录,并将对应的主数据记录在集团业务管理系统的保险登记单据上。
如无最优主数据记录,则自动在集团业务管理系统中,按系统规则创建对应主数据,并自动增加对应的保险业务单据。实现单据的自动录入,提升保单的录入效率和准确性。
(五)在整个逻辑处理工程中,调用第三方接口工具时,需考虑成本节约的原则,已通过OCR调用的历史信息不会重复调用。
四、关键技术需求:复杂场景中车辆与客户数据匹配优化算法
(一)算法需求目标
通过建立算法,实现车辆与客户数据的自动化匹配,提升数据处理效率,快速识别系统中最为相似的记录,从而增强数据质量并提高业务决策的准确性。
(二)算法需求内容
该算法模型应与当前的开发功能集成,并具备在多种数据特征与约束条件下的快速计算能力,输出最优匹配方案,包括相似度评分、匹配优先级和数据关联等关键指标。
该算法需综合考虑以下因素:
1.高匹配准确度与快速处理效率:算法应在确保高匹配准确度的同时,能够高效处理大量数据;
2.多类型数据匹配能力:需支持多种数据类型的匹配,包括但不限于品牌、车系、车型、姓名、手机号、身份证号、车牌号及发动机号等;
3.信息缺失与数据模糊处理:能够处理部分信息缺失或打码的情况,并对拼写错误、格式不一致等数据质量问题进行容错处理;
4.近义词与同义词识别:在数据匹配过程中,需支持对近义词和同义词的智能处理;
5.匹配字段权重分配:针对不同字段的重要性,灵活分配匹配权重,确保综合匹配效果最佳;
6.数据预处理与清洗:包括数据标准化、去噪等步骤,提升整体数据质量,为后续匹配提供高质量输入;
7.动态相似度阈值调整:支持根据实际业务需求,灵活调整相似度阈值,确保匹配过程中的灵活性与准确性;
8.大规模数据处理优化:针对大规模数据处理场景,需对算法性能进行优化,提升并发处理能力与响应速度。
算法应具备模糊字符串匹配能力,通过字符级匹配、词级匹配、部分匹配及排序匹配等技术应对拼写与格式上的轻微差异。在实际应用中,算法将支持在数据不完整或存在微小误差的情况下快速识别并匹配出与输入数据高度相关的记录。通过合理设置相似度阈值,可进一步限制匹配结果,提高处理效率与匹配质量。
五、征集时间:2024年9月23日--2024年9月27日
六、报名方式
有意向参与本项目的在京高校、科研院所,请以邮件形式回复,邮件内容包含但不限于参与人的学校/单位、所属部门、联系人及联系电话。
七、联系人及联系方式
联系人:刘女士
联系方式:15501207323、01050916067
邮箱:liuyanyang@xlbrauto.cn