本文共 2201 字,大约阅读时间需要 7 分钟。
可视化,被视为大数据落地的最后一公里。就如同人们去商场购物时,看见一件漂亮的衣服,但2000元略贵的标价或许会让部分用户产生犹豫,而可视化充当的作用就相当于给这件衣服贴上了打8折的标签,为最后的决策提供了助力。
在大数据领域,重要的是数据本身以及从中得到的价值,但同时可视化的推动作用,为不同年纪、不同职责的用户采用大数据提供了更好的体验,降低了认知的壁垒。
商业决策离不开互动性的可视化
目前的大数据可视化呈现,大多数以表格、饼图等方式展示,例如用户比较熟悉的支付宝用户的全年消费记录。虽然类似的可视化提供了直观的数据感受,但另一方面,不得不说其呈现的数据信息量有限,内容较为死板,特别是在商业上,难以提供更多的价值或知识。在硅谷领先大数据公司Taste Analytics数据可视化副总裁俞立看来,数据可视化不仅需要提供直观、形象的体验,同时还应该包含重点信息提取、可追踪,以及人机互动性增强两个方面。
“在商业决策上,企业需要的大数据可视化不仅是一张张大致方向上的图表,同时需要在这些图表上进行任意维度的选择,对真正重要、感兴趣的信息进行查找、追踪。”他表示,在最终数据呈现上,现在的可视化大多停留在数据包含哪些场景和要素领域,而对数据中最重要的人事物、数据发送时间地点、用户讨论这些场景与要素的位置等细节却无从追踪,所以企业难以得到更多的知识。
此外,目前国内大多数非结构数据分析产品,包括关键词提取、情感分析、舆情模型分析等,常常采用预先定义文档标签和关键词,来进行分类, 需要人工大量干预。“业界比较前沿的做法,是机器通过一定的规则进行文档自动分类。例如Taste Analytics的Signals平台不用定义标签,借助系统后台的焦点提取功能,通过机器学习和统计归类的方法,自动地提取出数据的分类模型,同时从语义方向分析这些数据。” 俞立,这位在学生时代便一直研究大规模时变数据可视化的博士表示,这类做法的优势在于,不仅人工干预少,可以更智能、客观地分析趋势;并且对于数据科学家等用户,可以在此基础上对分析结果进行调整,加入更多的参数或信息,机器便能重新学习并处理数据,呈现出一个更加准确的结果。
**结构化与非结构化数据融合分析**最终可视化结果的准确性与数据分析过程紧密相关。时下,越来越多的企业开始通过第三方平台,或服务外包来实现大数据分析,例如采用Salesforce、Answers Forsee等平台,或借助国内一些厂商的类似服务。尽管提供大数据分析服务的公司不少,但现有产品仍是以结构化数据分析为主,少量非结构化分析产品也是针对语义分析、情感分析、舆论分析等提供单一功能,很少将结构化数据和非结构化数据结合形成一套整体解决方案。
“现在Taste Analytics已可以同时实现结构化数据分析和非结构化数据分析。” 俞立表示。
例如大众点评中用户对万达影城的评论中,详细的语言评论是非结构化数据,环境、服务、视觉效果等评分是结构化数据。Taste Analytics平台将详细语言评论进行自动归类及焦点提取,分析出时间、地点、人物,以及语义焦点(最重要的词语,如负面评价、正面评价);同时在环境、服务、视觉效果评分等结构化数据导入系统后,可以得到具体城市如北京万达影城的环境、服务、视觉效果态度分布,以及基于这个分布用户的评论信息的关键词。通过“结构化数据+非结构化数据”下更多维度的分析,可以得出哪些焦点比较突出,用户为什么给出5分好评或2分差评。
所以这样结构化数据与非结构化数据分析的结合,可以带来更多深入的分析,在可视化呈现上,也不仅能表达出其他数据分析产品展示的“是什么”,同时还能表达出“为什么”。
可视化应同时服务两类用户
“从用户角度看,大数据分析应该越傻越好,越简单越好,人工干预越少越好。”Taste Analytics移动技术总监沈於众说道,尽管如此,但实际上大数据分析产品应该面向不同类型的用户,例如对于数据科学家、分析师,其可能需要更多的观察或与数据间的互动;而对于企业CEO、产品经理等,其需要最终呈现的信息能直击企业痛点,越重要越好。所以Taste Analytics的可视化便是同时服务这两类人群,专业的数据分析师、科学家,以及对数据分析“业余”的决策层人士。
另一方面,在可视化技术实现上,采用SVG和HTML 5已经成为业界事实上的规范。
拥有10年框架设计经验的沈於众表示,现在Taste Analytics的产品便是基于Facebook提出的最新的React.js,通过自己的内部延展而形成高性能、高互动性的实现,“通过统一的人机互动设计、精简的图像可视化阵线,我们Signals平台把复杂的数据分析过程简易化。尤其是当我们的用户可以在平板电脑、手机、PC、笔记本等终端上,以相近的用户体验来随时分析数据时,我们的平台极大程度地提升了客户的数据分析能力和理解能力。”
“我们选择了各种美国先进的网络设计语言,同时编写出了一套自己的优化体系。Signals在最终平台上呈现的效果也算业界领先,所以最终数据可视化的效果、页面相应速度、内存上的优化,在同行里也优势突出。” 沈於众解释道。
目前,Signals平台能够为用户提供10余种图像可视化模式,并且支持客户自定义分析,共包括15种不同的可视化分类。
本文转自d1net(转载)