热搜词:

建设自动驾驶可信数据空间需确保数据高效流通

派生万物AI 图

可信数据空间是推动自动驾驶数据开发利用、促进数据要素合规可信流通的数字基座、技术基石和信任基础,也是加快推进自动驾驶产业发展的重要驱动力。自动驾驶可信数据空间的建设涉及法律、技术、标准、信用、伦理和机制等诸多方面,需要全局统筹、系统谋划。应兼顾数据的价值密集性、流通高效性及基座稳定性要求,形成“四化”价值引领、“三跨”环境营造和“七统一”支撑保障相融合的一体化推进机制。

一、明晰数据价值“四化”进阶路径

可信数据空间的建设,首要任务是明确数据的价值实现空间与能级。在数字化转型中,应依循“数据化、情报化、智能化和智慧化”的“四化”路径,逐步形成从数据采集到范式变革的进阶。

数据化是数字化转型的基础阶段,核心是通过各种技术手段采集、存储和管理交通相关数据。情报化是在数据化的基础上,通过数据分析、挖掘和处理,融合自动驾驶知识体系,将原始数据转化为有价值的信息和知识。智能化是在情报化的基础上,利用人工智能、机器学习等技术,实现自动驾驶系统的自动化与自主式决策。智慧化是数字化转型的最高阶段,核心是通过技术融合和模式创新,实现自动驾驶系统乃至交通系统的全面变革和升级。

二、营造数据流通“三跨”运行环境

可信数据空间的建设旨在为自动驾驶数据流通提供一个安全、可信、高效的环境,其核心是营造“三跨”数据流通运行环境。

一是跨界互赢:数据流通运行环境应体现国家、产业和个人多元主体的共赢,支持国家战略(如数字经济、智慧交通)的实施和数据主权维护,并参与国际竞争;为企业提供高质量的数据资源,保护企业的数据财产,促进公平竞争;在保护个人隐私的前提下,让个人也获得数据流通带来的价值和利益。

二是跨域互通:数据流通运行环境需打破部门、行业和地域界限,推动政府部门之间的数据共享开放,促进不同行业之间的数据开放流通、支持跨界创新,支持跨境内外数据授权服务,推动国际化合作。

三是跨链互认:打破链间壁垒,利用跨链技术(如中继链、哈希锁定),实现不同区块链之间的数据交互和价值转移;通过共识机制和智能合约,确保跨链数据的一致性和可信性;支持跨链场景下的数据共享与协同应用,构建统一的数据流通生态。

三、数据要素技术需实现七个统一

一是统一数据供需入口。通过采用“主体-场景-标准-治理”四维融合的统一数据供需入口架构,将数据提供方与需求方精准匹配,促进数据资源的优化配置与高效利用。

多主体接入平台:通过平台化手段支持政府机构、车企与自动驾驶企业、科研机构、第三方服务商等多主体的自动驾驶与交通行业数据资源接入。

场景化数据封装:针对交通管理优化、自动驾驶训练、城市交通规划、车路协同控制等核心应用场景,开发标准化、模块化的即插即用数据包。

数据标准体系建设:建立数据格式统一、时空基准一致、数据质量分级的数据规范体系,部署自适应PETL(Processing-Extract-Transform-Load)工具链。

一体化数据治理架构:构建采集层、传输层、应用层的统一数据治理架构,对数据进行全生命周期管理,保障数据安全合规。

二是统一数据通识语料。包括“核心定义、语料来源、语义解析、应用适配”等四大模块。明确定义自动驾驶领域的核心术语和数据实体本体模型,确保各方对数据理解一致,建立统一的数据分类体系,明确数据之间的关系,制定元数据标准,描述数据的来源、格式、质量、用途等信息。明晰语料来源,具体包括期刊论文、标准规范、专业书籍、软件著作权、科技成果、政策文件、学位论文、会议论文、发明专利、交通资讯、专业交通数据库、教材课件、培训材料、其他等14类数据语料资源。语义解析通过建立标准化术语映射、上下文元数据标注及多模态数据时空对齐规则,消除数据语义歧义,实现跨源异构数据的精准关联与可解释性理解。通识语料通过标准化数据切片、治理指标转换与跨域协同接口,适配算法训练、交通治理与联邦学习等多场景需求,支撑高效应用。

三是统一数据合规认证。通过建立“人准入、数准入、物准入、过程审核”的全方位审核机制,确保数据流通的合法性、安全性与可信性,规范数据流通与共享流程。“人准入”,即对参与数据流通的主体(如数据提供方、使用方、第三方服务商等相关法人)进行合规性认证。“数准入”,即对流通中的数据资源进行合规性认证,包括数据来源认证、数据内容审核、数据质量评估等。“物准入”,包括合同签署、数据生产真实性声明等文件和凭证的合规性认证。在此基础上,“过程审核”旨在对数据生产、数据加工、数据资源登记、数据产品登记和数据流通存证等全过程进行合规性审核。

四是统一数据权属存证。通过明确“资源持有权、加工使用权、产品经营权以及责任与风险的分配”的存证,为自动驾驶可信数据空间建设提供坚实的权属保障。针对自动驾驶与交通行业数据资源的原始持有主体多元特征,明确这些主体对其收集数据的资源持有权,保障数据源头的合法性。加工者使用权严格按照授权范围,如限定的加工算法、数据使用期限等进行操作,确保原始数据持有方的权益不受侵害,同时保障加工后数据的合规性与安全性。依据著作权法、数据交易相关规则,明确数据产品的版权归属,详细规定经营许可范围,包括销售对象、使用地域、许可期限等。通过建立统一的责任追溯与风险预警机制,明确数据持有者、加工者、使用者等各方的收益分配和责任归属(如数据安全责任、隐私保护责任),记录数据流通中可能存在的风险(如数据泄露、滥用)及其分担机制,提供基于存证记录的争议解决机制,支持法律追责与赔偿。

五是统一数据公共信用。构建信用评级、失信认定、惩戒与修复的全链条管理公共信用生态。

其中,“信用评级”对数据行为主体在数据流通中的信用水平进行量化评估,构建全面的信用评级指标体系,基于实时数据行为(如数据共享频次、违规记录)动态调整信用等级。

“失信认定”对违反数据流通规则的行为进行识别与定性,明确失信行为的认定标准,如自动驾驶数据造假,篡改运输轨迹、流量数据以获取不当利益;依托可信数据空间的全量数据记录,结合监管部门信息,通过数据比对和核实,按照既定标准进行失信认定。

“失信惩戒”对失信主体采取限制性措施,限制其在自动驾驶数据交易市场的参与权限,如禁止参与某些高价值的数据交易项目;联合金融机构,提高其贷款利率、限制信贷额度;向社会公示失信信息,降低其商业信誉,促使其重视信用修复。

“信用修复”允许失信主体通过整改恢复信用等级,设定合理的信用修复条件,如失信主体在规定期限内纠正失信行为,补缴欠款、整改违规业务等;参加信用培训课程,提升信用意识;主动参与社会公益活动,以实际行动弥补失信影响,逐步恢复信用等级,重新获得在自动驾驶领域乃至交通行业的正常经营和数据交易权利。

六是统一数据融合范式。通过制度集与开发链的双管齐下,形成统一的数据融合范式,促进多源异构数据的集成、融合与增值利用。

制度规约上,建立健全包含数据标准规范、共享流通、隐私保护、安全防护等在内的制度集,明确数据提供方、使用方和管理方在数据融合开发中的权利与义务。

在技术路径上,通过明确“要素提取-图谱构建-可视化分析”开发链,推动数据资源的融合利用与价值提升。要素提取:从海量交通数据中提取关键要素。运用数据挖掘和数据清洗技术,挖掘交通事件与相关影响因素之间的潜在联系,去除噪声数据和异常值,提高数据质量,为后续分析提供可靠的数据基础。图谱构建:以提取的关键要素为节点,要素之间的关联关系为边,利用知识图谱技术,整合多源异构数据,实现数据的结构化表示。可视化分析:通过交互式可视化工具,将融合后的数据以直观的可视化方式呈现,有助于管理者、企业决策者快速理解数据内涵,做出科学决策。

七是统一数据产品登记。自动驾驶数据产品登记工作全流程涵盖申请、受理审查、公示及凭证发放等环节。

标准化申请流程:申请主体通过国家数据产品登记平台完成主体注册后,进入数据产品登记模块提交结构化申请材料。智能化受理审查:登记机构依托自动化审核引擎,在规定时间内完成字段规范性等形式审查与数据处理合规性核验等实质审查双重校验。

透明化公示机制:通过审核的数据产品,平台同步公开数据摘要、应用范围及质量评级,公示界面嵌入异议反馈通道,支持利害关系人提交实名异议及举证材料。

电子化凭证管理:公示期满无异议的数据产品,系统自动生成含国家统一编码、采用数字水印与区块链存证双重防伪技术的电子凭证。

(作者涂辉招系同济大学城市风险管理研究院副院长、交通学院教授,博导)