caravel系列之案例讲解与分析
文章目录
我们以官方的示例数据为例(sqlite数据库中的birch_names数据表)
想体验真实数据的小伙伴可以登录我的demo中一看究竟demo births,用户名和密码都是test
birch_names
birch_names是一张数据表(table),来自于数据库:sqlite:////tmp/caravel.db
数据一览
以上便是我们的原始数据,那么原始数据是如何一步步变为开篇那幅图表的呢,下边为你揭晓
workflow
添加数据源
填写数据信息
完成后点击Test Connection
,底部将列出数据库中所有的数据表
添加表
注意到图片上方有3个tab页,分别为:Detail、List Table Column和List Sql Metric,默认打开Detail(如上)
List Table Column:
List Table Column中的操作决定,各个字段可以做哪些操作(操作类型有,Groupable(分组),Filterable(过滤),Count Distinct(统计有多少种不同值),Sum(求和),Min(最小值),Max(最大值) Is tempora(是否是时间序列字段)),如果你熟悉SQL,你应该一眼就能看懂什么意思
值得注意的是表中必须有一个日期或时间类型的字段
List Sql Metric:
Metrics意为度量,做统计时,时常会遇到这个词,折腾elk是就遇到
Druid.io文档中有:
Metric columns: Metrics are columns used in aggregations and computations. In our example, the metrics are clicks and price. Metrics are usually numeric values, and computations include operations such as count, sum, and mean. Also known as measures in standard OLAP terminology.
在List Sql Metric页面,可以编辑和定义指标,如果上面对一些字段勾选了Sum、Min、Max、Count Distinct选项,则这里会自动生成相应的指标字段。
可视化探索
我们以table为中心,这里我们已经定义好了birch_names表的维度字段和指标,下边我们可以开始对它进行探索
开始探索
在页面中,可以针对birch_names事先定义的字段和指标字段进行可视化探索。
下边是我们探索的一个成果,是不同名字的变化时序图
实际上它是以下SQL的可视化
而我们在左边面板选择参数的过程就是动态生成SQL语句的过程
收获探索成果
- 将探索结果导出为JSON或是CSV
- 将探索的成果保存为slide,之后可以分享给同伴
- 将slide拼接为dashboard(就是这篇文章最初的那幅图)
- 将探索成果生成iframe嵌入到其他页面里(当报表用)
我们带现连自适应也做的很好
坑
生成iframe
直接分享url没有问题,而iframe的尺寸有问题(caravel版本为0.10.0)
参考
文章作者 种瓜
上次更新 2016-07-26