Superset 官方入门教程中文翻译 (2)

是否有一些字段你需要去求和的,或者想要得到一些基本的统计信息?那么 求和最小值最大值 列会有帮助

所有的日期或者时间字段,都应该勾选上 表示时间(原文是 is temporal )。我们将会在稍后讲述它们是如何操作的。

(译注:目前我安装上的版本中,只剩下可分组、可过滤、表示时间这三个选项了)

以下是已经针对天气数据配置好的字段。对于天气数据的测量(比如降雨量、降雪量等等)来说,根据以下这些字段它已经足够去分组和过滤的了:

如上图所示,点击 保存 按钮以保存这些配置。

探索数据

要探索数据,只需要在表列表中点击你刚才创建的表的名字即可:

weather-data-denormalized

默认地,展现在你面前的是表视图(Table View):

让我们使用一些基本的查询来统计表中的所有记录数。首先,我们需要更改 时间(Since)过滤器来取得数据的时间范围,你可以通过一些简单的词语来应用这个筛选,例如“3年前”:

since

而这个时间区间的上限,在 Until 过滤器中,默认是 现在,当然这个可能并不是你想要的。

再看到位于 分组 下方的 指标 部分,可以在其中输入 “Count” —— 你会看到一个根据你的输入而匹配出来的指标列表:

选择 COUNT(*) 指标,然后点击位于探索器顶部旁边的绿色按钮:

query-button

你将会右侧的表格里看到查询结果:

让我们在 分组 区域中,以 weather_description 字段为分组,取得以天气记录类型为分类的记录数有多少:

执行查询:

让我们查找一个更加有用的数据:在 2015 年有记录的温度最高的时间和地点的 TOP 10。

在 分组 区域中,把 weather_description 替换为 latitude,longitude 和 measurement_date:

同时在 指标 区域中,把 COUNT(*) 替换为 *max__measurement_flag*:

*max__measurement_flag* 指标是在我们前面配置表的时候,勾选了 measurement_flag 字段对应的 Max 选框而创建的,指明这个字段是一个数值并且当需要根据指定的字段进行分组的时候我们要在其中查询它的最大值。

在本案例中,measurement_flag 是测量所需要使用到的值,它很明显是依赖于测量的类别的(研究者会记录不同的降雨量和气温的值)。因此,我们必须仅在 weather_description 相等于 “Maximum temperature” 的记录中过滤我们的查询,这个过滤会在探索器窗口底部的 过滤 模块中进行:

filters

最后,由于我们仅关心 top 10,所以我们要限制我们的查询结果为 10 条记录,通过位于 Options 头下方的 行限制 来实现:

点击 查询 然后可以得到如下的结果:

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zywyzg.html