什么是大数据?
大数据是指以不断增长的速度增长的庞大而多样化的信息集。它包括信息量,创建和收集信息的速度或速度,以及所涵盖的数据点的种类或范围(称为大数据的“三个v”)。大数据通常来自数据挖掘,并以多种格式到达。关键要点
- 大数据是大量多样化的信息,其到达量越来越大,速度越来越快。
- 大数据可以是结构化的(通常是数字的,易于格式化和存储)或非结构化的(更自由的形式,更难量化)。
- 公司中几乎每个部门都可以利用大数据分析的结果,但处理其混乱和噪音可能会带来问题。
- 大数据可以从社交网络和网站上的公开共享评论中收集,从个人电子产品和应用程序中自愿收集,通过问卷调查、产品购买和电子签到。
- 大数据通常存储在计算机数据库中,并使用专门设计用于处理大型复杂数据集的软件进行分析。1
大数据的工作原理
大数据可以分为非结构化或结构化。结构化数据由组织已在数据库和电子表格中管理的信息组成;它通常是数字性质的。非结构化数据是无组织的,不属于预定模型或格式的信息。它包括从社交媒体来源收集的数据,这些数据有助于机构收集有关客户需求的信息。大数据可以从社交网络和网站上的公开共享评论中收集,从个人电子产品和应用程序中自愿收集,通过问卷调查、产品购买和电子签到。智能设备中传感器和其他输入的存在允许在广泛的情况和情况下收集数据。
大数据通常存储在计算机数据库中,并使用专门设计用于处理大型复杂数据集的软件进行分析。许多软件即服务 (SaaS) 公司专门管理此类复杂数据。
大数据的类型
- 结构化数据
- 非结构化数据
- 半结构化数据
大数据的用途
数据分析师查看不同类型的数据(如人口统计数据和购买历史记录)之间的关系,以确定是否存在相关性。此类评估可以在内部或外部由第三方完成,该第三方专注于将大数据处理成可消化的格式。企业经常使用此类专家对大数据的评估将其转化为可操作的信息。
许多公司,如Alphabet和Meta(前身为Facebook),使用大数据通过向社交媒体上的用户和网上冲浪的用户投放有针对性的广告来产生广告收入。
大数据的优缺点
可用数据量的增加既带来了机遇,也带来了问题。一般来说,拥有更多关于客户(和潜在客户)的数据应该可以让公司更好地定制产品和营销工作,以创造最高水平的满意度和回头客。收集大量数据的公司有机会进行更深入、更丰富的分析,以造福所有利益相关者。虽然更好的分析是积极的,但大数据也会产生过载和噪音,降低其实用性。公司必须处理更多的数据,并确定哪些数据代表信号而不是噪声。决定什么使数据相关成为一个关键因素。随着当今个人可用的个人数据量增加,公司采取措施保护这些数据至关重要;这个话题已成为当今网络世界的热门争论,尤其是在过去几年中公司经历了许多数据泄露的情况下。
此外,在对数据采取行动之前,可能需要对数据的性质和格式进行特殊处理。由数值组成的结构化数据可以轻松存储和排序。非结构化数据(如电子邮件、视频和文本文档)可能需要应用更复杂的技术才能发挥作用。
大数据的重要性
大数据很重要,因为人们可以从任何来源获取数据,并对其进行分析以找到答案,从而降低成本,减少时间,新产品开发和优化产品以及明智的决策。一些企业使用其系统中收集的大数据技术来改善运营,提供更好的客户服务,提高盈利能力,并根据特定的客户偏好创建修改后的营销活动。而且,当将大数据分析与高性能分析相结合时,您可以完成与业务相关的任务,如下所示:
- 近乎实时地定义故障、争议和缺陷的根本原因。
- 根据客户的购买习惯在销售点创建门票或代金券。
- 在几分钟内评估整个风险组合。
- 在虚假绩效影响您的组织之前识别它。
大数据应用行业
大数据的应用为银行、政府、教育和医疗保健等各个领域提供了解决方案。银行业
由于有大量数据从无数来源涌入,银行需要找到不常见和非常规的方式来管理大数据。检查客户需求、根据其规格提供服务并在保持法规遵从性的同时降低风险也很重要。金融机构必须处理大数据分析来解决这个问题。- 纽约证券交易所(纽约证券交易所):纽约证券交易所每天产生大约 1 TB 的新交易数据。所以想象一下,如果每天生成一TB的数据,那么一整年将有多少数据需要处理。这就是大数据的用途。
政府
政府机构利用大数据,并设计了许多运行机构,管理公用事业,处理交通拥堵或限制犯罪的影响。然而,除了在大数据方面的好处外,政府还解决了透明度和隐私问题。- 阿德哈尔卡:印度政府拥有所有1.21亿公民的记录。存储和分析这些庞大的数据以找出几件事,例如该国的青年人数。根据该计划,制定了几种针对最大人口的计划。所有这些大数据都不能存储在一些传统的数据库中,因此只能使用多种大数据分析工具进行存储和分析。
教育
有关大数据的教育对学生、学校系统和课程产生了至关重要的影响。通过解读大数据,人们可以确保学生的成长,识别有风险的学生,并实现一个临时的评估和协助校长和教师的系统。- 例: 教育部门拥有大量有关课程、学生和教师的信息。对信息进行分析以获得可以提高教育组织运营充分性的见解。收集和分析有关学生的信息,例如出勤率、考试成绩、成绩和其他问题会占用大量数据。因此,大数据接近一个渐进的框架,其中可以存储和分析这些数据,使机构更容易使用。
医疗保健领域的大数据
当谈到大数据在医疗保健中是什么时,我们可以看到它正在被大量使用。它包括收集数据、分析数据、为客户利用数据。此外,患者的临床数据过于复杂,传统系统无法解决或理解。由于大数据由机器学习算法和数据科学家处理,因此处理如此庞大的数据变得易于管理。- 例: 如今,医生主要依赖患者的临床记录,这意味着需要收集大量数据,对于不同的患者也是如此。旧的或传统的数据存储方法不可能存储这些数据。由于有大量数据来自不同来源,以各种格式,因此增加了处理大量数据的需求,这就是需要大数据方法的原因。
电子商务
维护客户关系是电子商务行业中最重要的。电子商务网站有不同的营销理念,可以向客户零售商品,管理交易,并实施更好的策略,将创新理念与大数据结合使用,以改善业务。- 翻转卡丁车:Flipkart是一个巨大的电子商务网站,每天处理大量流量。但是,当Flipkart上有预先宣布的销售时,流量呈指数级增长,导致网站崩溃。因此,为了处理这种流量和数据,Flipkart使用大数据。大数据可以帮助组织和分析数据以供进一步使用。