博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
互动性可视化,打通大数据最后一公里
阅读量:5965 次
发布时间:2019-06-19

本文共 2201 字,大约阅读时间需要 7 分钟。

image

可视化,被视为大数据落地的最后一公里。就如同人们去商场购物时,看见一件漂亮的衣服,但2000元略贵的标价或许会让部分用户产生犹豫,而可视化充当的作用就相当于给这件衣服贴上了打8折的标签,为最后的决策提供了助力。

在大数据领域,重要的是数据本身以及从中得到的价值,但同时可视化的推动作用,为不同年纪、不同职责的用户采用大数据提供了更好的体验,降低了认知的壁垒。

商业决策离不开互动性的可视化

目前的大数据可视化呈现,大多数以表格、饼图等方式展示,例如用户比较熟悉的支付宝用户的全年消费记录。虽然类似的可视化提供了直观的数据感受,但另一方面,不得不说其呈现的数据信息量有限,内容较为死板,特别是在商业上,难以提供更多的价值或知识。在硅谷领先大数据公司Taste Analytics数据可视化副总裁俞立看来,数据可视化不仅需要提供直观、形象的体验,同时还应该包含重点信息提取、可追踪,以及人机互动性增强两个方面。

“在商业决策上,企业需要的大数据可视化不仅是一张张大致方向上的图表,同时需要在这些图表上进行任意维度的选择,对真正重要、感兴趣的信息进行查找、追踪。”他表示,在最终数据呈现上,现在的可视化大多停留在数据包含哪些场景和要素领域,而对数据中最重要的人事物、数据发送时间地点、用户讨论这些场景与要素的位置等细节却无从追踪,所以企业难以得到更多的知识。

此外,目前国内大多数非结构数据分析产品,包括关键词提取、情感分析、舆情模型分析等,常常采用预先定义文档标签和关键词,来进行分类, 需要人工大量干预。“业界比较前沿的做法,是机器通过一定的规则进行文档自动分类。例如Taste Analytics的Signals平台不用定义标签,借助系统后台的焦点提取功能,通过机器学习和统计归类的方法,自动地提取出数据的分类模型,同时从语义方向分析这些数据。” 俞立,这位在学生时代便一直研究大规模时变数据可视化的博士表示,这类做法的优势在于,不仅人工干预少,可以更智能、客观地分析趋势;并且对于数据科学家等用户,可以在此基础上对分析结果进行调整,加入更多的参数或信息,机器便能重新学习并处理数据,呈现出一个更加准确的结果。

**
结构化与非结构化数据融合分析**

最终可视化结果的准确性与数据分析过程紧密相关。时下,越来越多的企业开始通过第三方平台,或服务外包来实现大数据分析,例如采用Salesforce、Answers Forsee等平台,或借助国内一些厂商的类似服务。尽管提供大数据分析服务的公司不少,但现有产品仍是以结构化数据分析为主,少量非结构化分析产品也是针对语义分析、情感分析、舆论分析等提供单一功能,很少将结构化数据和非结构化数据结合形成一套整体解决方案。

“现在Taste Analytics已可以同时实现结构化数据分析和非结构化数据分析。” 俞立表示。

例如大众点评中用户对万达影城的评论中,详细的语言评论是非结构化数据,环境、服务、视觉效果等评分是结构化数据。Taste Analytics平台将详细语言评论进行自动归类及焦点提取,分析出时间、地点、人物,以及语义焦点(最重要的词语,如负面评价、正面评价);同时在环境、服务、视觉效果评分等结构化数据导入系统后,可以得到具体城市如北京万达影城的环境、服务、视觉效果态度分布,以及基于这个分布用户的评论信息的关键词。通过“结构化数据+非结构化数据”下更多维度的分析,可以得出哪些焦点比较突出,用户为什么给出5分好评或2分差评。

所以这样结构化数据与非结构化数据分析的结合,可以带来更多深入的分析,在可视化呈现上,也不仅能表达出其他数据分析产品展示的“是什么”,同时还能表达出“为什么”。

可视化应同时服务两类用户

“从用户角度看,大数据分析应该越傻越好,越简单越好,人工干预越少越好。”Taste Analytics移动技术总监沈於众说道,尽管如此,但实际上大数据分析产品应该面向不同类型的用户,例如对于数据科学家、分析师,其可能需要更多的观察或与数据间的互动;而对于企业CEO、产品经理等,其需要最终呈现的信息能直击企业痛点,越重要越好。所以Taste Analytics的可视化便是同时服务这两类人群,专业的数据分析师、科学家,以及对数据分析“业余”的决策层人士。

另一方面,在可视化技术实现上,采用SVG和HTML 5已经成为业界事实上的规范。

拥有10年框架设计经验的沈於众表示,现在Taste Analytics的产品便是基于Facebook提出的最新的React.js,通过自己的内部延展而形成高性能、高互动性的实现,“通过统一的人机互动设计、精简的图像可视化阵线,我们Signals平台把复杂的数据分析过程简易化。尤其是当我们的用户可以在平板电脑、手机、PC、笔记本等终端上,以相近的用户体验来随时分析数据时,我们的平台极大程度地提升了客户的数据分析能力和理解能力。”

“我们选择了各种美国先进的网络设计语言,同时编写出了一套自己的优化体系。Signals在最终平台上呈现的效果也算业界领先,所以最终数据可视化的效果、页面相应速度、内存上的优化,在同行里也优势突出。” 沈於众解释道。

目前,Signals平台能够为用户提供10余种图像可视化模式,并且支持客户自定义分析,共包括15种不同的可视化分类。

本文转自d1net(转载)

你可能感兴趣的文章
Java操作mongoDB2.6的常见API使用方法
查看>>
如何给服务器设置邮件警报。
查看>>
CEF js调用C#封装类含注释
查看>>
麦克劳林
查看>>
延时接通电路
查看>>
周爱民:真正的架构师是没有title的(图灵访谈)
查看>>
Eclipse SVN修改用户名和密码
查看>>
架构师的职责都有哪些?
查看>>
SVN: bdb: BDB1538 Program version 5.3 doesn't match environment version 4.7
查看>>
jsp内置对象作业3-application用户注册
查看>>
android115 自定义控件
查看>>
iOS uuchart 用法
查看>>
c# 多线程 调用带参数函数
查看>>
JQuery 如何选择带有多个class的元素
查看>>
The absolute uri: http://java.sun.com/jsp/jstl/core cannot be resolved in either web.xml or the jar
查看>>
VS快速生成JSON数据格式对应的实体
查看>>
Word2vec 模型载入(tensorflow)
查看>>
Linux内核——定时器和时间管理
查看>>
J2EE之初识JSP
查看>>
RabbitMq消息序列化简述
查看>>