一个数据产品的交易历程(一线调查·扩内需畅循环)

光山新闻网 采集侠 2022-11-28 07:00:07
浏览

一个数据产品的交易历程(一线调查·扩内需畅循环)

 

  北数所所在的国际大数据交易产业园区外景。
  北数所供图
  数据来源:新华社等

 

一个数据产品的交易历程(一线调查·扩内需畅循环)

 

  在北京经济技术开发区,一辆“主驾无人、副驾配备安全员”的无人驾驶车正在行驶中。
  彭子洋摄

 

  数据,作为一种新型生产要素,已快速融入生产、分配、流通、消费等各个环节。

  党的二十大报告提出,构建全国统一大市场,深化要素市场化改革,建设高标准市场体系。今年6月,习近平总书记在主持中央全面深化改革委员会第二十六次会议时强调:“促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。”

  数据交易是构建数据要素市场的关键一环。今年2月至7月,通过北京国际大数据交易所(以下简称“北数所”),北京海天瑞声科技股份有限公司和禾多科技(北京)有限公司完成了一笔人工智能算法训练数据产品交易。一个数据产品从采集、处理到交易、应用的过程是怎样的?如何探索建立合规高效的数据要素流通和交易制度?记者近日追踪了这次数据产品交易的全程,一探究竟。

  数据采集——

  数据越真越全越精,越能提升人工智能“聪明”程度

  打左转向灯起步、遇到过路行人减速绕行……在北京市石景山区的首钢园自动驾驶服务示范区内,一辆辆自动驾驶汽车可以精准识别路况,做到安全起步、行驶、落客。

  “只要在手机应用程序上下单,车辆就自动开到眼前来;点击小程序的‘开始行程’按钮,车辆就启动了。”北京市朝阳区居民王女士对自动驾驶技术既赞叹不已,也十分好奇,“这左拐右拐、上坡下坡的,它是怎么判断的呢?”

  “自动驾驶的实现,是基于人工智能技术、先进传感器、高精地图等进行的技术‘大综合’。人工智能技术就相当于自动驾驶系统的‘大脑’。”海天瑞声是一家人工智能数据资源和服务提供商,公司副总经理李科告诉记者,为了使这个“大脑”更“聪明”,就需要运用各类数据来训练人工智能算法,“人工智能算法做出判断大致要经历‘接收数据’‘总结规律’‘形成判断’3个环节,数据样本类型越全、精度越高、针对性越强,算法就会越聪明,自动驾驶系统的智能化水平就会越高。”

  这次数据产品交易中,自动驾驶解决方案提供商禾多科技公司需要自己采集真实场景的原始数据,这些数据由海天瑞声进行专业处理后,形成人工智能算法训练数据,用于自动驾驶系统研发。

  如何保证数据“原材料”的高质量?有效采集至关重要。

  “数据采集要尽可能接近真实路况。”禾多科技副总裁戴震介绍,在近期的一次数据采集中,工程师驾车从北京市顺义区出发,途经望京区域、机场高速和4个停车场,行驶路程100多公里,现场采集到了道路状态、交通信号和标识、车辆和行人目标以及天气环境等信息。

  “多位专业工程师驾驶数据采集车,车上安装了雷达、摄像头和传感器用以收集数据。采集到的数据经过合规处理,会被记录在车载硬盘内,之后通过网络闭环上传至数据处理系统,为下一步的筛选、标注做好准备。”戴震说。

  据介绍,海天瑞声与禾多科技今年完成交易的数据产品,其中许多涉及停车场景。“为人工智能算法提供的训练数据,针对性越强,越有助于提升其在特定方面的智能化水平。”戴震说,有时根据客户的需求,为了提升场景的针对性,团队还会专门设置一些具体的情境。