汽车,作为一个承载着海量电子元器件集合体,在行驶过程中会产生海量数据。而随着数据驱动时代的到来,数据的价值在业内已达成共识,各主机厂花费了极高成本采集、存储这些数据。然而落实到如何用数据支持研发、赋能业务甚至开创新的盈利点,却一直是各大车企的难题。甚至有人灵魂发问:“每年收集和运维数据花这么大代价,这些数据到底又给车企带来多大价值呢?“
数据存在硬盘里,当然是不会产生价值的,数据的价值体现在如何使用上。本文将介绍一个专为汽车行业打造的大数据分析平台,为主机厂提供了一个用好数据、提质增效的解决方案。
根据中研普华研究报告《2022-2027年互联网汽车产业深度调研及未来发展现状趋势预测报告》统计分析显示:
“在汽车全产业链实现数字化,正成为中国车企在新能源时代意图打造的核心竞争力。根据第三方不完全统计,包括一汽、长城、吉利、比亚迪、长安以及蔚小理等多家中国车企,都已经开始独立或联合外部团队将数字化引入管理、研发、生产等全流程。“
然而,也许因为参与这场变革的车企团队和供应商,大多是从传统IT领域转型而来,在遇到车辆数据这类专业性极强的数据类型时,却遇到了水土不服的情况,车企耗费极大成本采集到的车辆数据,往往只用于一些简单的统计分析和报告,车辆数据作为车企的核心资产,没有发挥其应有的关键作用。
车辆数据本质为传感器时序信号数据,有许多异于常见数据的特点,需要一些非常专业的处理手段,才能够将这些数据处理成有价值的数据:
直接采集的信号是低密度传感器变量,需要处理时间浓缩、含义归一。
车辆数据的产生和含义是时序性和窗口性的,需要车辆动力建模+时序窗口抓取。
车内外行为有多种上下文关系,需要识别特征关联与变化。
完整的人车路场景不易获得,需要机器学习智能辅助预测。
同时懂车+大数据+分布式+分析的人少,需要专业工具降低门槛
车辆数据只有经过专业处理,才能够支撑大数据分析,进而赋能车辆生命周期中的研发、测试、量产运营、用户体验提升、售后排故、二手车评估等各个阶段。为了简化整个流程,需要一个平台对采集到的车辆数据、其他部门如研发实验数据、外部数据进行归集整理、清洗治理、统计分析、或更高级的智能识别和挖掘,并以业务需求为导向,以报表、大屏、动态交互等形式按需展示。
这些结果能够从整车开发测试、量产运营、用户体验提升、售后排故等车辆全生命周期帮助主机厂提质增效。同时如果能够与车端边缘计算配合,能够持续迭代海量数据训练的模型算法,将迭代的算法快速部署到汽车域控进行模型迭代和灵活数据采集,形成良性数据闭环,就能够实现对车辆用户体验、开发测试能力、售后排故能力、量产运营能力等的持续提升。
EXD数据分析平台,行业首个为汽车量身打造的车联网数据开发平台
智协慧同的EXCCEEDDATA解决方案在解决以上问题有着天然的优势:
来自博世、大陆、恒润等一线汽车供应商的资深汽车行业专家,来自teradata、IBM等掌握底层数据技术的IT大牛,组成了既懂汽车,又懂数据的混编团队。
EXD自成立以来就专注在解决汽车行业数据问题这条细分赛道,经过多年沉淀,已经形成一套自成体系的、经多家主机厂验证的成熟方案。
EXD的数据方案,经过国内多家主机厂的验证,在行业内处于绝对领先地位,尤其是对高精车辆数据的采集、存储、分析、闭环的能力,已帮助多家车企解决了许多关键的数据问题。
EXD的数据分析平台专门为车辆数据分析定制化设计,能够针对车辆数据的特征,进行专门的处理,经过工况特征提取,搭建数据集市,并形成各类数据报表和服务,满足主机厂各业务部门对数据分析的需求。
平台专门针对汽车信号数据提供了预处理,功能包括:对接入的结构化数据集与非结构化数据集进行清洗(行列计算、空值插补、类型转换、去重处理、过滤删除)、集成、变换(信号平滑、信号处理、数学转换、坐标识别)、规约(连续值规约、离散值规约、排序)等一系列预处理操作,将不规范的原始信号数据值处理为满足分析建模需求的规范数据值。
工况场景提取是车辆大数据分析的核心步骤(基础步骤),通过不同的过程感知模式与过程函数语法识别车辆工况的发生过程,从而将低层次的规范信号值转换为高层次的驾驶工况,实现数据值到业务场景的价值升华。EXD平台具备多种工况场景的过程感知模式,能基于工况的机理规则用高层次的抽象方式而不是编程来定义并完整识别过程的开始与结束、并基于完整的过程计算场景的定性值或输出场景细节数据。
经过多年的沉淀,EXD已经积累了大量的机器学习模型,能够支撑主机厂针对驾驶行为分析、能耗、空调、用户画像等业务诉求。
EXD数据分析平台能够支持丰富的应用场景,举例说明:新能源汽车行驶过程中,即使行驶速度相同,但因驾驶人员自身操作的差异使得踏板发生变化的频率不同,从而导致新能源汽车能耗受到影响。
基于EXD数据分析平台,运用神经网络与非线性数据自回归算法,分析驾驶员历史驾驶行为数据,可以开发出驾驶行为识别数据模型,并将该模型写入到新能源汽车的BMS 中,从而对BMS 功能优化提供辅助。这一模型能够对启动紧急制动、加速启动等不良驾驶行为加以识别并进行提醒,从而帮助驾驶员优化驾驶行为。
此外,随着汽车由传统交通工具变为“行驶的数据中心”,汽车相比于手机、电脑有更大的空间可配备强大的计算、各类传感器和网络基础设施,而新能源汽车相比于传统汽车,电动化和智能化网联化程度更高,未来,大数据分析平台在新能源汽车整个产业链将有广泛的应用前景。
EXD大数据分析平台将在产品规划和定义环节发挥越来越大的作用,基于社交媒体的潜在客户相关数据,信息大数据分析将逐渐取代传统的小样本、定向客户走访调研等,进一步挖掘用户潜在更深层次的需求,客户画像将更加精准。
基于EXD大数据分析,产品快速迭代与优化将变为现实,研发工程师可以及时收集到大量的车辆行驶相关数据和用户驾驶行为数据,基于大数据分析结果,工程师可以不断优化设计、迭代产品,让汽车像手机一样不断升级。
在自动驾驶相关技术逐渐落地的同时,随着新能源汽车智能化程度越来越高,5G、人工智能、大数据、云计算等技术的不断进步,智能汽车与智能交通、智慧城市的融合一体化发展也是大势所趋,智能交通、智慧城市将赋能智能汽车实现更多功能。
EXD大数据分析还可以用于OTA升级、调试、售后等方面,包括:
(1)主动预测维护:实现基于认知的服务前台,车辆维护的智能辅助系统。基于实时的车辆行驶过程数据监测(包括电池状况、油温、部件磨损情况等),可以及早发现质量问题,实现持续的质量监控、车辆诊断和早期维修,OTA 升级,提供主动服务等;(2)以需求为导向的零部件存储;
(3)基于驾驶行为大数据的车损评估,以使用情况为定险基础的保险;
(4)基于大数据分析的千人千面出行服务(社交导航、汽车共享、预报、事故、交通堵塞)等等。
利用整套数据分析平台和专业团队,EXD团队在汽车行业沉淀了大量数据分析案例。尤其是针对车辆专业数据的处理,EXD已经沉淀了一套数据处理体系能力。在某主机厂的数据分析项目中,遇到数据质量较差的问题。常见质量问题来源如:
主机厂因各类需求要求,数据的存储被定义为各类形式,如:
1、存成 json 包( {key:value} 形式),耗费内存,拆解费时
2、信号名做特殊映射,如G0001,仅主机厂内部有信号解析配置,且解析配置是人工记录与维护
3、信号值全部存储为string格式,保留被传回的所有可能的信息,包含乱码
4、数据存储以hive、hbase、txt压缩文件、二进制文件(blf 等)等多种不同形式
5、数据被按照企业设定的分组拆开存储,如位置数据、电池数据,即使是同一个时间点的数据,也分别以不同的表存储
上述问题给数据的读取、解析带来了不同程度的困难,同时,这些存储操作也会给数据带来专有的质量问题。
1、TBOX读取数据协议(808、32960、J1939等),嵌入式工程师代码bug,信号读取错误
2、TBOX与企业大数据平台的通信和存储协议,平台工程师代码bug,信号解析和存储错误
3、新能源国标、地标、企业协议转来转去,映射规则不清晰,转发错误
4、协议解析各环节对异常值的规定不一致,有些是发送原值,有些是将错误值修改为默认值,有些是发送协议默认值(如65535),有些是发送该信号的最大或最小值,参差不齐
EXD数据分析团队,利用自有平台优势,采用多种数据处理方式进行数据质量处理。如利用特殊算法发现数据中的异常点。以数据所符合的算法原理(如车速转速公式关系)、机器学习算法(无监督)对异常值进行挖掘。
通过离群点分析发现了正向思考很难发现的BMS故障:
用EXD数据分析平台进行基于机器学习算法的智能挖掘,发现多台车的电压值的一个异常现象,经验证为BMS逻辑错误。极大程度提升了数据可用性,为下一步业务分析的准确性提供了关键支撑。
EXD数据分析团队多年来服务于国内各大主机厂,帮助多个客户完成了复杂的数据分析业务,助力车企解决了许多业务问题。以EXD数据分析平台在某国内一线主机厂运行情况为例,平台由EXD数据分析团队运维,服务于客户的5个业务部门,覆盖产品研发、产品改进、用户画像、售后服务、客户营销、移动出行等6大业务领域,支撑12个业务场景,完成35个大数据算法模型,研发基础模型总量超过100个。
EXD通过自研的数据闭环,采集车辆10ms级别精度以上的高精数据,并利用算法下发到车端执行,极大的优化了该车企工作流程,节约分析时间。加上EXD团队专业的特征提取、特征分析、关联分析、机器学习回归分析、机器学习分类预测、生存分析、统计分析、聚类分析等能力,帮助该主机厂提升发现问题,解决问题的效率。
电池问题分析, 热管理分析,能耗分析,续航里程分析,云端电池。
用户画像,驾驶行为,充电行为,行驶轨迹,车辆换道识别,车辆故障/异常(电池、电机、胎压等),试乘试驾管理。
智协慧同的数据分析平台,配合其灵活的高精度高质量数据采集方案,为车企打造了真正的数据采集-价值挖掘-成果应用闭环,目前已在多个车企落地运行,智协慧同将与车企一道,持续挖掘数据价值,打造更多场景应用,让车辆数据真正成为能持续创造价值的车企核心资产。