如何布局大数据处理分析能力

如题所述

第1个回答  2016-12-14
当下,大数据作为最流行的一个方向,被很多企业重视。那么如何提升企业的大数据能力,以发掘出它最大的价值?(远标-ITjob)

一个成年人平均每天做出70个有意识的决定,一年就要做出超过25000个决定。企业的大部分决定是不重要的,但这其中会有一些决定给企业带来重大的机遇或者严重的后果。企业无法避免做出坏的决定,但是可以通过提升数据和分析能力降低做出坏决定的概率。(远标-ITjob)

数据和分析并不是一个新的概念,早在上个世纪的两股宏观经济潮流中就已形成。第一股潮流是劳动力,从劳动力密集型产业向技术密集型产业转型。第二股潮流是二十世纪六十年代,企业引入了决策支持系统。(远标-ITjob)

随着不断增加的智力工作者从事高科技工作,存储的资料和数据量也随之提升,大数据分析在企业决策制定和执行中扮演越来越重要的角色。(远标-ITjob)

但是企业在初期是很难整合数据并将数据分析应用于他们的日常运营中。他们所收集的数据变量有限,且数据以不同的格式和结构存储在不同的地方。从这些含有噪音的数据中过滤出相关的,有效的数据困难程度会随着数据量的增大呈指数级数上升。据IDC研究报告:2005年到2012年,全球的数据量翻了27番,约达到2.5ZB,其中仅有25%的数据是有用的。(远标-ITjob)

许多具有行业领导地位的企业已经意识到需要提升组织内部收集、存储和分析数据的必要性。企业需要为提升大数据能力投入更多的资源,以让其全面发挥潜在的作用。对大数据能力的投资需要遵循数据分析的价值链,布局于5个方面。(远标-ITjob)

(1)、大数据的收集与前期准备:要有效地收集和管理大规模、复杂的数据集。企业数据产生于各地独立的数据库。为了后期最大化数据的使用,企业应制定相应的数据标准,确保数据的准确性、一致性和可转换性。(远标-ITjob)

(2)、大数据处理:数据必须能被实时处理。在一些竞争激烈的领域,对企业来说,比竞争对手提前几天可能就能存活下来。因此企业需要评估基础架构、算法,编程语言,以提高数据的处理速度。(远标-ITjob)

(3)、大数据可视化:处理完的数据需要以简单易懂的方式呈现出来。人脑对大规模数据或文本数据的处理是缓慢的,因此企业可使用可视化工具提升对数据认知、洞察的能力。(远标-ITjob)

(4)、大数据分析技术:可视化数据应被解读正确地解读。企业应尽量避免错误的数据解读对认知造成的偏差。仅靠直觉亦或是极端推崇数据结论都可能将企业引向歧途。(远标-ITjob)

(5)、改进:智力工作者必须提供反馈与指导。企业要促进利益相关者的反馈机制,形成反馈闭环。这种反馈机制能够连续的分析、学习、问题识别给予支持,从而扩大信息的数量与范围。(远标-ITjob)

企业要获得大数据的潜在价值的困难是艰巨的。这些困难横跨多个领域,如预算、技术的可获得性、已有基础架构的使用、运作模式等等。然而,能够有效使用数据、洞悉先机的企业将在行业里占有优势地位。而从长远来看,这样的企业将变成这个行业的领导者而非仅仅是参与者。
(远标-ITjob)
第2个回答  2017-09-04
优化数据收集
数据收集是最终导致业务决策的事件链中的第一步,确保收集的数据和业务感兴趣的指标的相关性非常重要。
定义对企业有影响的数据类型,以及分析如何增加价值。基本上,考虑客户行为,以及这将对企业的业务有何适用性,然后使用此数据进行分析。
存储和管理数据是数据分析中的重要一步。因此,必须保持数据质量和分析效率。
清除垃圾数据
垃圾数据是大数据分析的祸患。这包括不准确,冗余或不完整的客户信息,可能会对算法造成严重破坏,并导致分析结果不佳。根据垃圾数据做出的决策可能会带来麻烦。
清洁数据至关重要,涉及丢弃不相关的数据,只保留高品质的数据,当前,为了获得完整和相关的数据,人工干预不是理想的模式,不可持续并且受主观影响,
因此数据库本身需要被清理。这种类型的数据以各种方式渗透到系统中,其中包括随时间推移而变化,如更改客户信息或数据仓库中存储可能会损坏数据集。
垃圾数据可能会对营销和潜在客户生产等行业产生明显的影响,但通过基于故障信息的业务决策,财务和客户关系也会受到不利影响。其后果也是广泛的,包括挪用资源,浪费时间和精力。
解决垃圾数据难题的方法是确保数据进入系统得到干净的控制。具体来说,重复免费,完整和准确的信息。
如今,那些具有专门从事反调试技术和清理数据的应用程序和企业,可以对任何对大数据分析感兴趣的公司进行调查。数据清洁是市场营销人员的首要任务,因为数据质量差的连锁效应可能会大大提高企业成本。
为了获得最大的数据量,企业必须花时间确保质量足以准确地查看业务决策和营销策略。
标准化数据集
在大多数商业情况下,数据来自各种来源和各种格式。这些不一致可能转化为错误的分析结果,这将会大大扭曲统计推断结果。为了避免这种可能性,必须决定数据的标准化框架或格式,并严格遵守。
数据整合
大多数企业如今组成不同的自治部门,因此许多企业都有隔离的数据存储库或数据“孤岛”。这是具有挑战性的,因为来自一个部门的客户信息的更改将不会转移到另一个部门,因此他们将根据不准确的源数据进行决策。
为了解决这个问题,采用中央数据管理平台是必要的,整合所有部门,从而确保数据分析的准确性更高,所有部门的任何变化都可以立即访问。
相似回答