机器学习-TensorFlow应用之 binned features, Cross features和optimizer

日期：2021-08-14 栏目：程序人生浏览：次

这一节主要介绍一下TensorFlow在应用的过程中的几个小的知识点，第一个是关于features的处理的，例如Bucketized (Binned) Features 和 Feature scalling。第二个是简单的介绍一下常用的几个Optimizer之间的区别，例如SGD, Adagrad, Adam等等。这里主要是对前面一节的内容的一个小补充。其实关于feature的处理，我在前面已经用了很长一段时间在讲了，但是基本都是基于sklearn的框架来处理的，虽然前面咱们说了很多很多，但是总有漏网之鱼嘛，那就是Binned features，咱们这里就用TensorFlow来解释并且应用。还有一个部分就是optimizer，咱们前面说了一个SGD的应用，这一节我准备简单讲述一下另外两个常用的optimizer，他们分别是Adagrad, Adam，我会简单说一下它们之间的优缺点以及应用场景。

Bucketized (Binned) Features

Features engineering咱们在前面讲述了很多很多，并且都用sklearn演示了他们的应用和实现过程。这里补充一下Binned features的知识点，具体什么是Binned features呢？它其实很简单就是将咱们的数据按大小顺序分成n 个bins, 或者这里可以理解成n个quantiles，然后咱们将每一个bin的boundary记录下来放到一个list里面，最后将咱们的数据在应用到这个bin里面，看看咱们的每一个数据属于哪一个bin，咱的的结果是按照bin的大小从小到大一次是0,1,2，................这样。咱们可以看一个简单的实例

boundaries = [0, 10, 100] input tensor = [[-5, 10000] [150, 10] [5, 100]]

转载注明出处：https://www.heiqu.com/zyfppf.html

机器学习-TensorFlow应用之 binned features, Cross features和optimizer

相关推荐