车联网数据驾驶行为因子与车险风险相关性研究报告(节选)

来源:中国保险报网 2018-07-25 09:52:26

摘要
第1章前言1.1研究背景1.1.1研究工作背景车联网技术和数据的应用可能引发车险经营的深刻变革,不仅影响传统的经营模式,还能够帮助驾驶员改善驾驶行为,降低事故发生。依托车联网技术和数据进行的车险创新模式在欧美市场已经有了较长时间的发展,部分公司如美国的Progressive保险公司、英国的Insur

  第1章 前言

  1.1 研究背景

  1.1.1研究工作背景

  车联网技术和数据的应用可能引发车险经营的深刻变革,不仅影响传统的经营模式,还能够帮助驾驶员改善驾驶行为,降低事故发生。依托车联网技术和数据进行的车险创新模式在欧美市场已经有了较长时间的发展,部分公司如美国的Progressive保险公司、英国的Insure the Box保险经纪公司通过车联网保险培育了核心竞争力、获得了巨大商业成功。

  我国智能网联汽车逐步迈入产业化,越来越多的车辆具备了车联网系统,也为车险经营创新带来了新的机会。近年来,国内各保险公司或自行安装车联网设备、或与外部数据源合作进行数据采集、分析、建模,积累了丰富的研究和应用经验,但在也暴露出一系列问题,影响了研究和应用:

  (1)数据质量问题严重。对于车联网数据缺乏系统性地验证,由于终端设备、采集算法、压缩传输等各方面的原因造成的数据异常影响了研究效果。

  (2)研究数据样本量小。尤其是能够与保险数据匹配上的样本车辆更少,各保险公司目前的研究中小样本数据难以得到普遍适用的稳定结论。

  (3)数据清理能力较弱。车联网数据产生于各类传感器,受限于信号强弱、外部环境、突发故障等各种情况的影响,在使用前需要进行复杂的数据预处理,而保险公司的数据分析人员往往缺乏对于车联网底层数据的深度理解而无法胜任此项工作。

  (4)行车事件定义差异。对于行车过程中的某些事件(如急加速、急减速、急转弯、急变道等事件)的判定,技术处理存在差异,没有形成统一的认识和方法论,造成数据的不一致性,即增加数据处理成本,也导致数据难以共享共用。

  车联网数据应用不同于传统车险定价,涉及终端硬件、数据采集算法、数据压缩传输、数据清洗、数据建模等一系列复杂的过程,需要保险公司和车联网数据服务商达成共识,建立信任机制,共同搭建研究平台,汇聚各方数据和智慧资源,联合完成。

  1.1.2 研究工作组织

  在监管部门的要求和指导下,中国保险信息技术管理有限责任公司(简称中国保信)积极开展车联网保险应用研究工作。2016年7月22日,中国保信邀请了中国人民财产保险股份有限公司(简称人保财险)、中国平安财产保险股份有限公司(简称平安产险)、中国太平洋财产保险股份有限公司(简称太平洋产险)等9家财险公司的专家研讨,研讨会各方达成共识,委托中国保信组织保险行业成立项目组,联合车联网科技公司开展乘用车车联网数据风险因子测算研究工作。项目组经调研沟通,甄选确定了上海评驾科技有限公司(简称评驾科技)、北京车网互联科技有限公司(简称车网互联)、彩虹无线(北京)新技术有限公司(简称彩虹无线)、大连楼兰科技股份有限公司(简称楼兰科技)、深圳市成为智能交通系统有限公司(简称深圳成为)、江苏迪纳数字科技股份有限公司(简称迪纳科技)、上海弘西信息技术有限公司(简称弘西信息)联合开展研究。

  中国保信提供测算需要的办公设施、软硬件系统环境,并从全国车险信息平台提取样本车辆的车险承保理赔数据,上述七家车联网科技公司提供研究所需的乘用车车联网数据,其中车网互联提供的数据量最大。项目组测算工作由来自中国保信、人保财险、平安产险、太平洋产险、阳光产险、评驾科技、车网互联、楼兰科技、彩虹无线、深圳鼎然信息科技有限公司(鼎然科技)等公司的专家合作完成,聘请鼎然科技李欣女士担任项目首席精算顾问。

  本报告由程丹(中国保信)、吕定海(评驾科技)、耿文童(车网互联)、张霈雯(阳光财险)、徐轩(人保财险)、刘东(中国保信)、王春博(太平洋产险)、彭帝(平安产险)、李政达(中国保信)、于丹(楼兰科技)、丛均均(楼兰科技)、赵炜(评驾科技)分章节执笔起草,并由程丹、吕定海负责整体报告的撰写。

  1.2 研究目的

  此次联合研究是保险行业和车联网科技企业第一次尝试较大规模数据的融合研究,开展富有建设性的基础探索,希望为未来跨行业的车联网数据应用研究积累经验,奠定基础。总体上看,本次研究实现了预定的目的:

  (1)探索车联网数据衍生出来的车险风险因子。本次研究将车联网驾驶行为数据和车险承保理赔历史数据进行了关联,并采用单因子分析、多因子统计分析等技术手段,寻找与车险出险风险密切相关的车联网风险因子,是此次研究的核心目的。

  (2)建立联合研究机制,搭建跨行业研究平台。本次研究联合了多家保险公司、车联网科技公司,建立起了彼此信任、共商共议的研究机制,并在数据安全性、资源共享等方面进行了深度探讨,初步建立起的跨行业研究平台,将成为未来车联网保险研究领域的重要支撑。

  (3)积累研究经验,推动长期创新应用。各参与方积极贡献经验和智慧,在数据验证、数据需求总结、数据清洗、数据匹配、特征提取、因子测算等工作环节形成了系列标准方法,将为未来测算研究、标准制定的深化提供重要参考。车联网保险研究涉及人、车、环境等各项动态、静态大数据,也涉及传统精算定价法与机器学习相融合产生的新的方法论,本次研究过程中产生的一些想法、思路将有助于后续研究的进一步深化。

  第2章 车联网数据

  2.1基于风险评估的车联网数据需求

  车联网技术和数据可应用于车险经营管理的各个环节,在产品开发、客户关系管理、承保管理、理赔服务、防灾防损中科学采集、分析、应用车联网数据,可以有效优化流程,识别和管控风险、提升客户体验、降低运营成本。车联网数据保险应用的核心在于计算,基于车联网移动互联技术和车联网数据的分析测算,综合考虑驾驶习惯、车辆状态、驾驶环境等动静态数据,更为精准地测算风险成本,开发创新产品。

  2.1.1基于里程的车险产品(Pay as You Drive,PAYD)

  通过车联网设备获取被保险车辆真实行驶里程,保险公司据此合理厘定保险费率、承担保险责任。车主则根据自身实际需求,购买“里程包”,实现车险保费按照里程购买。PAYD产品将承保基础从车年调整为行驶里程,这种改变将激励车主减少用车,有利于保险监管者的目标达成,并实现更大范围的社会目标[1]。

  2.1.2基于驾驶行为的车险产品(Pay how You Drive,PHYD)

  通过车联网设备获取被保险车辆的驾驶行为关键指标,如时间、里程、速度、急转弯、急加减速数据等,并结合道路天气数据等,利用大数据分析技术精准测算风险成本、设计产品,通过事中、事后互动,提示驾驶风险、改善驾驶行为,降低事故率、增强客户粘性。

  2.1.3共享用车的车险产品

  共享汽车使用中,驾驶员、行驶路线、天气条件等诸多差异造成风险碎片化、场景化的特点,传统的车险产品无法做到准确识别和覆盖这些变化的风险,通过车联网技术和大数据分析结合可以实时动态识别变化的风险和计算风险成本,开发相应保险产品

  2.1.4智能驾驶安全责任类保险

  汽车“智能化”渐成现实,部分条件下车辆的驾驶决策和控制由车辆自身完成,一旦发生事故,需要判断车辆系统责任还是驾驶员的责任,并需要有相关的保险产品,此类产品的技术基础就是车联网系统。

  2.1.5车辆质量以及可靠性保险

  车联网技术能够通过各类传感器获取车辆关键系统的运行状况和故障信息,可为汽车保险责任范围拓宽提供技术和数据基础,如新能源车电池效能、车辆关键零部件质量、车辆延长保修等相关保险。

  本次研究对于车联网数据的研究聚焦在产品开发、风险评估层面,根据上述新的产品形态,梳理了具体的数据需求,见表1,对于其他经营环节(如精准营销)的数据需求,不在本报告披露的范围内。测算组立足于目前车联网数据的现实情况,在确保数据质量和规模的前提下,最大可能地获取从人、从车的车联网数据,此外由于数据源和系统资源限制,本次研究中暂不涉及路网数据和天气数据,因此使用的车联网数据仅仅涵盖了表1中的部分数据项。

  表 1:创新产品开发数据需求

  2.2 车联网数据采集终端简介

  车联网数据采集终端通常可以分为前装设备、后装设备和智能手机,本次建模分析用的车联网数据产生于多种形态的硬件,主要有OBD(注1)、T-Box(注2)、智能后视镜、行车记录仪等,下文简单介绍不同类别硬件的基本情况。

  2.2.1 前装设备

  前装设备通常指汽车在整车厂出厂时就会装备的电子设备,典型的前装设备有T-Box、大屏车机等。前装设备通常接入车辆的电力供应系统,可长久保持在线状态。前装设备通常连接CAN(注3)线,可读取许多由车辆本身安装的传感器产生的信息。

  除了通过CAN线读取车辆内置传感器数据外,部分前装设备内还装备了加速度计(G-sensor)和陀螺仪(Gyroscope)来进一步增强功能,表2列出了目前常见前装设备可以提供的典型数据集。由于前装设备本身的复杂性,具体每台设备可以提供的数据项因汽车生产厂商不同而存在差异。

  表 2:前装设备典型数据集

  前装设备一般遵循严格的汽车生产厂商的质量标准,产品质量稳定可靠,能在各种严酷环境下工作。前装设备的数据质量优良,原数据频率极高,且设备与车辆的映射关系强,一般认为设备产生的数据即是对应车辆产生的数据。同时,由于前装设备采用的数据传输协议一般为汽车生产厂商自行定义的标准,前装设备的安全性较好。

  然而在实际应用中前装设备也存在着一定的局限性。由于在应用前需要经过严格的、长时间的测试验证,前装设备的设计、开发周期较长。相应地,前装设备的设备单价也较高,数据成本高。

  2.2.2 后装设备

  后装设备指汽车在出厂后,由4S店或用户加装的设备。后装设备一般分为两种:连接车载诊断系统接口的设备以及不连接车载诊断系统的设备。两种设备在产品形态、可获取的数据维度上均有区别。典型的后装设备包含OBD盒子、胎压监测系统、智能后视镜、行车记录仪等。

  如上文中提到的,后装设备可以连接或者不连接车载诊断系统,两者可以提供的数据集与上文中的前装硬件类似。另外,部分后装设备装有加速度传感器、陀螺仪等惯性传感器,可进一步增强功能性。

  后装设备门类、形式多样,生产厂商也较多,竞争充分,因此设备的价格通常低于前装设备。后装设备的开发周期也相对较短,相对于前装设备可以更快地为消费者提供最新的技术体验。因此,后装设备在商业推广及应用上较前装设备存在一定的优势。

  后装设备很多情况下只遵从对应的电子产品质量标准,往往达不到车规级产品的质量要求,因而其数据质量稳定性比不上前装设备。后装设备通常连接的OBD接口,其数据协议除了基础部分外,各家厂商均添加了自定义部分,加之存在设备兼容性的问题,后装设备数据集的完整性和更新频率参差不齐。后装设备的设备与车辆的映射关系不如前装设备稳固可靠,但优于智能手机。一般认为,如后装设备可以读取到车辆的VIN(注4)信息,则后装设备产生的数据即是VIN对应车辆产生的数据。

  2.2.3 智能手机

  智能手机一般情况下具有以下传感器:卫星定位模块、加速度传感器、磁传感器、接近传感器,部分高端型号还具有气压计、陀螺仪等传感器。因智能手机多为用户随身携带,故检测到的运动数据不一定属于用户驾车数据,为保证业务的顺利进行,智能手机需要采集一些用于模式识别的数据项,智能手机可采集的典型数据集如表3所示。

  与前装以及后装设备相比,智能手机具有很多独特的性质。首先,智能手机可以认为在大部分时间内随用户移动,无论用户是否处于驾车之中。因此不论是用户乘坐其他汽车,还是利用轨道交通等公共交通方式,甚至用户静止时都可以采集数据。通过智能手机可以实现使用前装和后装设备数据无法进行的一些研究,比如用户的生活时间线分析。其次,智能手机通常为用户自有,运营中仅需考虑APP推广费用,成本较低。

  然而智能手机也存在很多明显的缺点,例如上文所述智能手机因随用户实时活动而不一定局限于用户乘车的情景,故设备与车辆的映射关系较弱。在进行UBI保险等与用户驾驶习惯密切相关的领域的研究时,需要先进行交通模式识别,确定为用户本人驾车才适宜使用其数据进行风险评估。高准确率的交通模式识别算法,尤其对用户的“驾驶员/乘客”区分归类是领域内的一大难题。其次,智能手机因内置传感器质量千差万别,与交通工具的固定方式可以是刚性或非刚性的,所以智能手机采集的数据集在使用之前要注意滤波等预处理阶段的兼容性和适用性。

  考虑到智能手机产生的数据存在的问题,本次测算未采用该类数据。

  表 3:智能手机典型数据集

  2.3 基于保险应用场景的车联网数据维度

  车联网数据可以应用于多种保险场景,在第2.1小节中已描述了在保险产品创新方面的应用。不同应用场景需要的数据量、数据质量均存在较大的不同,因此当评价数据是否具有价值时,首先需要描述清楚数据到底应用于何种场景。根据测算组对于市场上主流可以产生车联网数据的设备分析和总结,数据维度主要可以分为几个大类,即卫星定位数据、加速度传感器数据、陀螺仪数据、CAN线数据、人车标识数据。

  2.3.1 卫星定位数据

  卫星定位数据主要用于计算驾驶者以什么速度在什么地方驾驶车辆,并且如果数据采集的频率足够高,还可以基于定位数据间接推测整个驾驶过程中发生的异常事件,例如急加速事件、急减速事件等。通过路网数据、天气数据等第三方数据,还可以感知驾驶中的周边环境、天气情况。将该等数据与传统定价体系相结合,可以真正实现从人、从车、从环境的多维度定价体系。卫星定位系统有多种,无论何种系统,其产生的数据项主要包括表4中的内容:

  表 4:卫星定位数据

  对于上述数据的更新频率,不同的企业在采集数据的时候并没有统一的标准,均是按照各自的需求进行数据采集。卫星定位数据通常的更新频率可以达到1HZ,具体设备的更新频率由于技术、工艺等原因可能会低于该标准。对于大多数车辆制造企业,其通过前装硬件设备采集的定位数据更新频率往往远远低于1HZ,更多的是每15秒或者30秒采集一次数据,也有只采集驾驶行程开始和结束时的经度、纬度信息的。对于本次建模测算用到的数据,有部分数据直接取自原始定位数据,有部分基于原始定位数据计算得到。本次建模测算基于的数据项见表5,下面分别解释与卫星定位数据有关的数据项。

  (1)开始日期时间

  开始日期时间主要用来表示行程开始的时间,用于判断行程开始的具体时间,基于该数据项可以判断驾驶者经常驾驶车辆的时间段。此数据项可以识别出夜间开车、是否节假日出行用于综合测算,按照通常的观点,夜间开车由于下述几个原因将导致行车风险上升:

  a)夜间驾驶员视线受影响;

  b)夜间人体生物钟影响,容易产生睡意,注意力不集中;

  c)夜间对面驶来的车辆强光照射,致眩晕,干扰视线;

  d)下雨的夜晚,由于路面积水反射光线,致眩晕,干扰视线。

  注:1.On-Board Diagnostics,即车载自动诊断系统,简称为OBD,是一种用于监控车辆运行状态、上报异常事件的系统。

  2.Telematics Box,简称T-Box。

  3. Controller Area Network,即控制器局域网络,简称CAN或CANbus,是由ISO 11898标准定义的通信协议,被广泛应用于包含车辆计算机控制系统在内的场景。

  4. Vehicle Identification Number,即VIN,代表车辆的身份证号,它根据国家车辆管理标准确定,包含了车辆的生产企业、年代、车型、车身型式及代码、发动机代码及组装地点等信息,由17位字符组成,也称为VIN码。

  中国保险信息技术管理有限责任公司

关键字: