让我们考虑一下这是动力驱动系统方法的应用。我们已经确定了我们的目标:建造一辆自行驾驶的汽车。可调因素是我们熟悉的车辆控制装置:方向盘,加速器,制动器等。接下来,我们考虑汽车需要收集哪些数据; 它需要传感器来收集有关道路的数据,以及可以检测路标,红灯或绿灯以及意外障碍物(包括行人)的摄像机。 我们需要定义我们需要的模型,例如用于预测转向,制动和加速度影响的物理模型,以及用于解释道路标志数据的模式识别算法。
正如谷歌自动驾驶汽车项目的一位工程师在最近的连线文章中所说的那样,“我们正在每秒20次分析和预测世界。”报价中丢失的是由于这种预测而发生的事情。车辆需要使用模拟器来检查可能采取的行动的结果。如果它现在左转,它会撞到那个行人吗?如果在这些天气条件下以55英里/小时的速度右转,它会在路上滑行吗?仅仅预测会发生什么并不够好。自动驾驶汽车需要采取下一步措施:在模拟所有可能性之后,必须优化模拟结果,以选择加速和制动,转向和信号的最佳组合,以便我们安全地前往圣克拉拉。预测只告诉我们可能会发生的事故。优化器则告诉我们如何避免事故。
改进数据收集和预测模型非常重要,但我们希望强调先定一个实现目标的重要性,即通过产生可操作结果的可调因素来定义明确的目标。数据科学甚至已经开始渗透到我们生活中最实际的元素中。随着科学家和工程师越来越擅长将预测和优化应用于日常问题,他们正在将其扩展生活中的方方面面,从我们的个人健康到我们居住的房屋和城市的一切。开发模拟流体动力学模型已经通过使用出口和拥挤控制障碍作为可调因素来改善交通和行人流量。这提升了地铁站的紧急疏散效率,减少了在体育赛事中人群踩踏和践踏对人的生命安全的危险。Nest正在设计智能恒温器,可以了解房主的温度偏好,然后优化他们的能耗。对于机动车交通,IBM与斯德哥尔摩市合作开展了一项项目来优化交通流量,减少了近四分之一的拥堵,并将城市的空气质量提高25%。特别有趣的是,没有必要建立一个精心设计的新数据收集系统。任何有红绿灯的城市都已经拥有了所有必要的信息;他们只是没有办法从中挖掘其价值。
在另一个基于目标的数据产品有能力改变生活的领域,硅谷的CMU扩展项目有一个积极的项目,用于构建数据产品,以帮助建立自然灾害或人为灾害后的及时响应系统。卡内基梅隆大学的Jeannie Stamberger向我们解释了预测算法在灾难响应中的许多可能应用,从文本挖掘和推文的情绪分析到确定损害的程度,以及成群的自主机器人进行侦察和救援,物流优化工具,帮助多个司法管辖区协调其响应。这些灾难应用程序是一个用来告知我们为什么数据产品要简单,为什么接口要精心设计的特别好的例子。在紧急情况下,仅产生更多数据的数据产品几乎没有用处。数据科学家现在拥有预测工具来构建可增加共同利益的产品,但他们需要意识到,如果不能产生优化的可实现的结果,那么仅仅构建模型是不够的。
数据产品的未来
我们引入了动力传动系统方法,为设计下一代优秀数据产品提供了框架,并描述了优化对于该框架的重要性。在未来,我们希望在商学院和统计部门中看到优化课程。我们希望数据科学家能够提供旨在产生理想成果的产品。这仍然是数据科学的未来发展方向。我们不知道在将来会开发出什么样的设计方法,但是现在,数据科学界需要关注共享词汇和产品设计过程,这些过程可以用来告知人们如何从中获得价值。如果我们不这样做,我们会发现我们的模型只是使用数据来创造更多数据,而不是使用数据来驱动行为,变革行业并改变生活。
免费领取验证码、内容安全、短信发送、直播点播体验包及云服务器等套餐