行内人都晓得,二手车交易的外围问题在于车况信息不通明。中国二手车交易市场制度尚不欠缺,长期以来短少行业公认的车辆估值规范和车况检测规范,二手车商提供的估值和车况信息不够通明。这导致用户和车商交易单方都陷入了循环窘境:用户对车商信赖有余,购买志愿低;二手车商短少潜在客户线索,为招揽客户不惜采纳虚伪信息,使得市场环境进一步好转。为推动车况信息的透明化,汽车之家二手车不断完善优化“车史档案”,使二手车出险记录查得率达到 98%、维保记录查得率达到 85%,同时还有天天拍车平台发展线下检测业务,获取实在的车况数据欠缺档案数据。
现阶段,多方面的车辆信息已实现了物理层面上的集成,但在语义内容的解析和信息的视觉出现上还有待深入研究。用户须要亲自浏览碰撞、维保、电池报告来了解其中的内容,报告内容的丰富性、专业性与可读性将对用户的交易决策产生重要影响。例如用户浏览 APP 时被汽车外观、内饰的照片所吸引,却可能因不理解汽车车体构造和车况排查规范而无奈精确了解相应的碰撞、维保、电池报告中所蕴含的泛滥内容,最终导致交易转化失败。
一、提出解决方案的第一步:明确指标
汽车之家二手车将利用数字能力和数据资源一直推动车况信息的透明化、标准化,使用户更易理解车况信息,进步用户决策效率和线索转化效率。具体来说,汽车之家二手车联合机器学习、自然语言解决和 VR 全景等技术重塑了二手车购买的业务场景,将二手车车源在估值、车史、VR 全景展现三个维度的信息进行了集成与交融,以交互式可视化的模式出现给用户,使用户更快捷、直观、详尽理解二手车车源的车况和估值,升高用户的信息搜查老本和信息了解老本,促成用户做出交易决策。
图 1. 传统二手车买车场景和数字化二手车买车场景比照
如图所示,传统的二手车交易须要用户在不充沛理解车辆信息的状况上来与二手车商预约线下看车,再依据看车人的教训常识做出主观的评断。而数字化的二手车买车业务则是用户间接通过 PC、APP 从云端获取标准化的车辆信息,充沛理解车辆信息、初步评估后再决定是否线下看车,无效进步线下看车的效率。汽车之家二手车在为用户发明数字化体验的过程中,除了促成购车交易,也进步了买车新模式的商业增长。
二、制订解决方案:构建“买车新模式”
1、业务场景
图 2. 二手车买车业务架构
二手车买车业务流程架构如图所示。结构化的数据来自从汽车之家二手车交易平台中的二手车的车辆数据、交易记录等数据。其中,二手车的车辆数据中包含省份、城市、车型、上牌工夫、行驶里程、公布工夫、过户次数等各种数据,二手车交易记录中包含成交价格、交易类型、检测车况等数据。这些结构化的数据按用于估值模型的训练,预测车辆在以后及将来的价格趋势。
半结构化的数据是指从第三方获取的车辆出险记录,4S 店维修保养记录、天天拍线下检测记录以及电池数据记录,这些记录具备多种数据类型,须要转化为对立的数据格式,解析其中的语义内容,抽取结构化的信息。对于新能源车的电池数据通过加工解析生成电池在线检测报告,综合得出维保、碰撞、电池等多维度的车史报告。
全景数据是指通过 VR 外观相机和 VR 内饰相机所拍摄的原始图像数据,原始图像数据通过 VR 拍摄组件生成 VR 图片,再通过 APP、H5 端的 VR 播放组件进行展现。从非结构化数据中抽取出的结构化信息除了造成车史报告,也能够与 VR 中图像进行跨模态的语义对齐,例如车史报告中如提到“左前门碰撞”,则能够在 VR 展现中提醒出左前门的状态异样。估值、车史和 VR 展现将独特出现于用户界面。
当用户浏览通过 PC、APP 浏览二手车车源详情时,可在用户界面查看车辆估值信息,查问车史报告,VR 全景看车,从价值、车况、外观内饰三个角度来评估车辆是否合乎需要,决定是否购买或留下购车线索。
2、技术难点
估值:车辆的数据十分复杂,通常包含了区域、车龄、里程数、车型、车系、外观、内饰、车况等多达上百维的特色信息,并且这些特色存在着数据的局部缺失或特色间多重共线性的简单关系,给二手车价格的预测模型带来三大挑战:模型预测的准确率,模型推理的计算效率,模型的可解释性。尽管现有的机器学习技术如神经网络或梯度晋升树模型能够端到端地解决简单特色,但车辆特色数据的复杂性使得此类办法不适宜用于二手车价格的预测,已有的二手车估值模型准确率较低。为解决上述三个问题,本估值模型采纳了分而治之的思路,将车源依照省份、城市和车型分组,再将分组后的车源数据中与工夫相干的数据进行量化解决,依据相关性筛选特色,训练多元线性回归模型。
VR 全景:现有的 VR 外观技术计划是采纳单反相机 + 长焦镜头拍摄,在自带转盘的影棚内进行车辆外观的 360° 拍摄;或采纳单反相机 + 鱼眼镜头拍摄,车内应用单反进行 4 面拍摄,而后采纳人工前期解决的形式实现全景 360° 图像的生成。毛病在于单反 + 影棚 + 转盘造价高,条件刻薄,拍摄车辆须要专人负责运输,效率低,前期图像处理繁琐,产出一辆车的外观 + 内饰图片过程长,对于人员业余度要求刻薄。而通过手机 APP 疏导拍摄 + 前期人工解决的办法所得图像不够精准,前期人工解决耗时长。二手车 VR 看车全新设计研发了基于模型、车辆轮廓辨认、陀螺仪、磁场传感器综合性的对被摄车辆和场地进行计算,给拍摄者提供便捷的定位拍摄计划。
车史档案:维修保养记录、碰撞记录和电池充放电记录的数据也同样面临着数据维度微小、数据品质不一、不足规范化的问题。比方维保记录和碰撞记录,有着多种形式的数据起源,既有半结构化的记录表单,也有记录文档,甚至还有拍摄或扫描的文档图像,须要对这些数据源进行加工解决,标准为对立格局的数据模式。在车况信息的抽取过程中,须要依据领域专家常识明确须要抽取的信息类型,建设车况评估和电池情况评估的常识模型以及相应的标准化术语词表,建设车况和电池的评分、评级模型。
3、实现办法
3.1 估值
图 3. 估值模型
对车辆进行估价,是二手车交易的重要环节,在交易过程中,须要依据车辆信息对二手车进行评估定价,取得较为精确估价区间。目前,咱们基于汽车之家丰盛的二手车车源数据研发了一种车辆估价模型, 来满足商家、用户对二手车车源价格的评估。
咱们的车辆估价模型次要应用的车源数据包含:天文区域、车型、行驶里程、上牌工夫、公布车辆工夫等,首选咱们须要车源数据中提取天文区域和车型,并依照天文区域、车型对车源数据中的其余维度数据进行分组,失去分组数据,再将分组后的车源数据中与工夫相干的数据进行量化解决,解决后的各组车源数据作为训练数据,训练多元线性回归模型,模型定义如下:
表 1. 不同理区域、不同车型对应预计模型的截距与回归系数
构建多个针对各个天文区域下的、不同车型的车辆估价模型,即每个省份对应多个车辆估价模型,每个省份、城市、车型下对应一个车辆估值模型。因为不同省份、车型的车辆价格存在肯定的差别,因而针对不同天文区域、车型训练不同的估值模型,能够无效缩小预测误差,使模型预计的准确性更高。失去针对各个天文区域下的、不同车型的截距与回归系数。
图 4. (左)- 依据信息预测估值;(右)- 历史成交和倡议
因而,本估值模型实质上是一个集成模型,顶层是按省份、城市和车型进行的分类模型,底层是对应类别的多个预测模型。当利用训练失去的车辆估价模型进行估价时,首先依据从客户端获取的天文区域、车型,抉择与天文区域、车型绝对应的车辆估价模型,再将从客户端获取的上牌工夫、用户公布车辆信息工夫、行驶里程输出以选取的模型,模型输入对应的高准确性的车辆估价。
3.2 VR 全景
在 VR 技术逐步遍及,可为用户提供新鲜的内容展示模式的背景下。因二手车一车一况,通过 VR 技术采集商家各辆车的内外图像数据,随车辆信息公布当前,可为用户提供更加直观、实在的车辆情况展现,线上车源 360° 展示,外观、内饰无死角细节浏览,晋升浏览体验。进步用户决策及线索转化,晋升到店转化率。同时也为商家提供了高质线索和用户到店率。
图 5. VR 全景拍摄技术流程
拍摄计划:载入用户抉择的对应年代款的车辆模型图 30 张,一套 360° 外观图须要拍摄 30 张不同角度的照片,以车辆为圆心,12° 为一个点,进行站位点划分,站位点与模型图角度进行强关联,每张图对应到一个站位点。应用手机内置陀螺仪 + 电子罗盘,通过计算可为拍摄者提供精准的角度地位信息,供拍摄者参考本身占位是否与模型图匹配;通过图像轮廓实时辨认能力,为拍摄者提供精准的间隔指引,罢黜人工丈量设置拍摄点位的繁琐步骤;当拍摄者按下拍摄按钮后,程序对拍摄的图片进行剖析辨认,保留车辆轮廓内的车辆清晰图片,对轮廓外的背景区域进行 20% 的高斯含糊图层生成,并对边缘进行羽化解决,拼合所有图层,失去最终的一个角度的外观图。本外观拍摄计划,简化了人工图像处理步骤,通过智能辨认算法,全自动生成预期的车辆清晰背景虚化的外观图片,极大的简化了车辆外观 360° 的拍摄流程,10 分钟内即可实现外观和内饰拍摄,并间接上传平台展现。
图 6. VR 全景多平台一体化集成计划
适配多端拍看一体化技术计划 (手机 App 拍摄 + App 双端 VR 播放组件 + H5VR 播放组件):
- 自研手机 360°VR 外观拍摄 App 组件;
- 自研集成化内饰 VR 拍摄组件, 反对多品牌 VR 相机连贯拍摄.;
- 自研 App 原生外观播放器控件;
- 基于 ThreeSixty 二次研发的外观 H5 播放器;
- 基于 Kpano 的内饰 360°H5 内饰播放器。
3.3 车史档案
图 7. 车史报告生成
图 8.(左)- 局部车史报告示例;(右)- 局部电池报告示例
车辆出险记录,4S 店维修保养记录和天天拍线下检测记录数据形式多样,局部图片数据须要先通过 OCR 转换为对立的文档格局,再从文档中抽取结构化的信息。首先建设车况评估和电池情况评估的常识模型以及相应的标准化术语词表,解决了哪些信息须要被抽取,信息彼此之间的关系是什么,信息该如何利用的问题。
具体来说,NLP 模型抽取出工夫信息,里程数、培修 / 理赔金额等数量信息,实体信息(汽车关键部位,如 A 柱、B 柱等)及相应的方位词(如正前方、后方左侧等)和动词(如切割、钣金、焊接等),并依据句法标注建设实体、方位词和动词之间的关系,形成形如“左 -A 柱 - 焊接”的语义短语,这样的语义短语是形容车辆碰撞培修历史的最小语义单元。
因为原始记录的不标准或 OCR 辨认过程中的误差,记录文档对汽车关键部位的形容可能不够精确或不够残缺,还须要根据事后建设的规范关键部位名词词表、动词词表、方位词词表进行规范化解决,失去标准化的关键部位名词、动词,以及相应的语义短语。
依据检测部位和事件类型,将车况排查分为骨架排查、增强件排查、水泡排查、火烧排查、里程排查、外观部件、变速箱 / 发动机排查、安全气囊排查八大维度。其中外观部件的排查信息能够与 VR 图像建设语义上的对齐,进而在 VR 层面进行视觉上的出现。依据标准化的关键部位名词与动词关系,制订了不同维度的车况评级规定,将抽取出的标准化语义短语映射为“ABCD”四个等级评级,最初综合八个维度的评级和车辆的出险记录、理赔金额、新车领导价格等信息对车况做出综合的评估,分为“优、良、中、差”四个等级。从抽取的语义短语、事件和数量信息生成车辆的碰撞历史明细、维修保养历史明细和历史里程明细。
随着新能源汽车市场的迅猛发展,汽车之家二手车也积攒了数万的新能源车源车主和对新能源车源有买车欲望的用户。除了获取车辆的维保、碰撞、里程车史,新能源车用户还对电池性能和电池续航能力的评估有着强烈需要。为此,二手车联结北理新源,利用新能源车电池大数据打造了新能源二手车智能车况云平台,将电池数据进行加工解决和评级,在汽车之家、二手车之家等相干产品上一键生成新能源电池一站式在线检测报告,实现电池性能实时评估和续航里程在线检测。
电池检测报告记录了电池出厂数据,并对电池评估数据、充放电数据、行驶数据和异常情况数据进行综合排查评估电池性能,计算出参考续航里程。综合解析以上维度的数据,构建了电池情况评分和评级模型,预测电池性能的评分并依照评分划分为优、良、中、差四个等级。
三、写在最初
汽车之家二手车针对二手车车辆数据和视觉展现进行了深度探索,建设了标准化的数据处理加工流程、办法模型以及可视化展现模式。面对海量的简单的车辆数据,以分治思维建设估值的集成模型,极大进步了估值的准确性,使用户可能精确理解以后车辆的价值;建设标准化的车史常识模型,通过算法模型和规定办法将碰撞、维保、电池的信息结构化,特地是新能源车电池在线检测报告,在业内处于翻新领导位置。
在视觉展现层面,翻新地利用软件技术解决了传统 VR 技术过于依赖硬件和人力导致的老本偏高,工夫偏长的问题,使商家可能轻松地拍摄 360° 全景影像,晋升购车用户的浏览体验。三个维度的信息通过数字技术解析并集成交融,重塑了二手车买车的业务数字化场景。
二手车买车业务是汽车之家二手车十分要害的业务线,在用户做出交易决策的过程中,可信且欠缺的车辆信息以及信息与用户的交互起到至关重要的作用。汽车之家二手车的愿景是继续推动业务的数字化转型,打造二手车流通的全数字化零碎,实现非标商品标准化,过程透明化,建设起一套赋能二手车行业数字化转型的新模式。