之前陆续写过几篇介绍数据挖掘/可视化项目Caravel的文章：

如今直接去github搜索caravel已经搜不到它了。它最近换了新马甲，改叫superset，至于为何频繁改名（分别叫过Panoramix，Caravel，Superset），我猜核心作者早年混迹论坛，与人吵架，常换马甲：）

对数据可视化的兴趣一直未减，近期发现两个有趣的项目，其一就是这篇文章的主角:Orange,另一个是google发布的Embedding Projector（基于Tensorflow）

Orange初体验

现在，你可以直接在这里下载到最新的Orange软件，Orange发布了各个平台的安装包，选择你当前平台的安装包，双击安装即可，安装过程十分友好。

和许多数据分析的项目不同，其他项目多数面向数据分析从业人员、软件开发者。而Orange让各行各业对数据挖掘和可视化感兴趣的人都能参与其中，而不必有编程基础

安装完毕打开软件，跟着以下教程即可对它做大致了解

简介

官方首页对这个项目的介绍是：

Open source machine learning and data visualization for novice and expert. Interactive data analysis workflows with a large toolbox.

该项目源码开放，对新手友好，同时也胜任专业的数据分析工作。

Orange是一个基于组件的数据挖掘软件，它包含了一组数据可视化、探索、预处理和建模的技术。

它不但带有一个新手友好的用户界面，老司机们也可以把它用作Python的一个模块。

交互式的数据可视化探索：你可以用它做简单的分析，诸如统计分布、箱形图（Box plot）、散点图。也可以做深入挖掘，诸如使用决策树、聚类、热图等。通过智能的属性选择，你可以在2维平面上探索多维数据
可视化编程：图形化界面允许你专注于探索数据，而不是编码。你要做的事只是在画布上拖曳小部件、连接它们、加载数据集，如此便可获得数据洞察力！
适合用于教学（jupyter出自生物学家之手，Orange似乎也和生物学领域有关，他们都让数据分析工作的协作交流变得简单有趣）

附加扩展功能：通过使用各种插件，我们可以做各种各样的事：

 *  对外部数据源进行数据挖掘（数据库/网络）
 *  自然语言处理以及文本挖掘
 *  网络分析
 *  关联规则分析

我折腾过的数据可视化工具多而杂，以下是我偏好Orange的几个原因

同时也简单列出我认为不足的地方

关于对数据库的支持，估计随着项目的推进，会慢慢完备起来，这块基本只是时间的问题

接下来有空我们分析下，这个项目在技术层面有哪些有趣的东西

此外我还有兴趣对它做些本地化改进，包括但不限于汉化，有兴趣的小伙伴可以一起来折腾，我已经fork了一份源码：orange3