销售咨询:400-830-0755 售后咨询:400-830-0780
售前咨询
100万+中小企业共同选择
金蝶集团旗下成员企业
×
友商网帐号 *原友商网注册帐号
云之家/精斗云帐号 *云之家与精斗云注册的帐号可通用
×

趋势|大数据越来越庞大 数据分析也越来越困难

在大数据森林里能找到黄金,但是大多数公司没有地图和队伍。

TDWI的一个新研究报告,题为《科学数据和大数据,企业的成功路径》概述了大数据和数据科学的状况。简而言之,它变得更大、更困难了。从1到5评分,5表示对当前的数据管理策略“完全满意”,只有3%的受访者给出了“5”分。

约43%的人给了中间分,近40%的人给出了1分或2分。

不满的一部分因为可能仅仅是被收集的数据量。20%的受访者正试图处理10-100TB的数据,而17%的人要处理100TB数据甚至超过一个PB的数据。现在大部分的数据是结构化数据,但企业明白需要整合更多不可预测的新输入数据到可用数据中。Hadoop是大数据平台的一种选择,大约30%的受访者现在企业内使用Hadoop,但是对于那些管理超过10TB数据的公司,有50%的人在使用。

管理的数据类型中,有些比其它增长更迅速。电子邮件中的文本内容、客服中心的记录,据说增长极其迅速,还有外部社交媒体的文本数据。

虽然大部分的受访者使用数据科学做出传统的报表和分析查询,有稳定的53%的人也使用它做出视觉分析。随着收集电子邮件中的文本/内容数据、客服中心、和社交媒体的迅速增长,预测分析在迅速上升,可能会创建必要的基础去更好地了解客户对新产品的反应或对客户服务的响应。

公民数据科学家

数据科学家已经存在很长时间了,但是这个角色最近变得更加复杂,因为企业正试图将大数据资产转化为真正的价值。在过去,数据科学家曾经是预测建模专业人士,一部分是计算机科学家,一部分是统计学家,一部分是数学家,一部分是业务分析师。

这个角色变化的原因很多,其中之一是“公民数据科学家”时代的到来,这一说法来自TDWI高级分析副总裁和高级研究主任。这些人是“统计探险者”的新一代,他们一般都是自学成才,希望用自助服务工具和数据访问做出他们需要的决定。做为业务用户,他们往往没有正式的统计培训,但得益于容易使用的分析平台。

最大的问题:发现大数据价值

大多数公司使用数据科学产生更精确的业务洞察力,然后更好地了解客户,预测行为,改善业务实践/流程。即使想要的结果多样,并没有一个单一的,可预测的路径成功使用大数据和数据的科学。根据这份报告,企业需要努力解决一些最大的问题才能看到积极的回报。

根据TDWI称,最可怕的是培训缺口。简单地说,数据科学技能是很难获得的,现在的需求远远大于供给。企业希望得到竞争优势,就可能会需要将注意力集中在接受内部培训和自学,以及派遣员工去企业外接受认证讲师的培训。(特别是物联网,我们报告的另一个挑战是设备和数据集成)。

帮助员工了解更多关于数据科学的实践是很重要的,但同样重要的是教育整个组织,尤其是管理者,知道数据科学是什么。没有自上而下的对实践价值的理解和兴趣,企业将受困于收集必要的资源,投入那些训练时间,新的基础设施,或投资新的分析工具。

为此,许多受访者报告了成功打造概念的小证据。这些证明使用业务正面临的实际问题展示数据科学的价值。如果他们能快速回报利益,就更好了。

最佳实践

报告最后提供了12个提炼数据科学和大数据的最佳实践。首先是让数据有序,对那些深入实践的人来说并不奇怪。建议分阶段实现新系统的方法,确保关键人员经过必要的培训才开始一个新的进程。TDWI建议企业使用多个分析方法,预测分析和文本挖掘或图形分析,利用云计算和新开源技术。

另一个被提到的趋势是,使用数据平台和大数据即服务减轻分析大数据的繁重工作。这个话题将在数据平台2017会议上讨论。

鉴于分析大数据固有的挑战,以及其他的担心,如害怕他们的工作将被机器学习算法所淘汰,2017年对数据科学来说不会是平凡的一年。但是,对于做法正确的公司,通过教育,合作和敏捷性,他们能迅速拿出概念的证据支持真正的ROI。

文字来源:数字化企业网