大数据技术:参数、使用领域和前景

Forum for discussing data insights and industry trends
Post Reply
subornaakter8
Posts: 116
Joined: Thu Dec 05, 2024 3:46 am

大数据技术:参数、使用领域和前景

Post by subornaakter8 »

大数据一词指的是大量信息,通常完全非结构化并存储在某种数字介质上。数据数组的大小如此之大,以至于无法使用传统方法进行处理。这一概念也被解释为一种用于搜索、分析、准备和解释大量信息结果的复杂技术。

“大数据”一词的作者被认为是克利福 饭团数据库 德·林奇 (Clifford Lynch),他于 2008 年在《自然》杂志的特刊中首次使用了该词。他评论了信息流的快速增长。大数据技术可以让您在24小时内处理大量超过150GB的数据。

什么是大数据

资料来源:shutterstock.com

许多统计公司的分析师计算出,2005 年,地球上的专家在虚拟空间中可以获得大约 4-5 艾字节(4-50 亿千兆字节)的信息。在短短五年内,大数据处理技术已经发展得如此之快,以至于可以组织高达 0.19 ZB (1 ZB = 1024 EB) 的数据。

2012 年,这个数字已经是 1.8 Zb,2015 年为 7 Zb。专家们合理预测,到 2024 年,大数据系统将运行 147 ZB 的信息。

Image



直到2011年,大数据数字技术还被认为是一种被积极研究和分类的理论,几乎没有任何实用价值。但信息量的快速指数级增长让科学家们面临着信息处理质量的问题。这一趋势在谷歌趋势统计中清晰可见。

这个问题得到了微软、IBM、甲骨文、EMC等数字行业巨头的密切关注。各大学和科学实验室的IT专家开始尝试找出什么是大数据技术。 2014年以来,我们开始尝试将发展落实到实践中。


也读一下!

“合作提案示例:只需按照说明操作即可!”
更多详情
大数据差异
尽管大数据规模巨大,但它并不是一个普通的数据库。它有其自身的根本差异。下表总结了其中一些。

常规数据库 大数据
包含数千名公司员工信息的数组。这些信息具有清晰的结构。主要参数很容易算法化,并且可以使用电子表格来呈现。 (例如,MS Excel) 员工活动日志。例如,一个普通呼叫中心(500 人)的员工在其活动过程中获得的信息的完整列表
社交网络 VKontakte 所有 25 亿用户的全名、性别、年龄信息只是一个巨大的数据库 关注 VKontakte 用户的链接、转发、点赞、点击和其他操作,包括移动版本
包含视觉监控摄像头录音的档案 包含有关交通违规信息以及州车牌记录的数据包;使用面部识别综合体获得有关乘坐地铁列车的所有乘客的信息,并与通缉犯数据库进行比较

大数据选项
它是什么——大数据技术?

以拉丁字母“V”开头的 有六个主要特征:

体积。每 24 小时容量至少为 150 GB。

速度。速度​​。大数据的结构和数量不断变化。因此,处理如此巨大的数组只能在具有高计算能力的机器上进行。例如,FlightRadar24 服务,它实时整合了飞机在空中的所有运动信息。

种类。种类。大数据可以由不同格式的数据组成:图形、音频和视频文件、文本等。

真实性。信誉。所有信息仅从经过验证的来源收集,并使用准确和客观的方法进行处理。只有这样你才能得到相关的结果。大公司在实施战略时会考虑到它们。

可变性。可变性。大数据每秒更新。数据流极其不稳定,取决于汇率、任何给定时间的源数量以及用户操作。因此,在分析时必须考虑所有这些可变因素。例如,有关空中交通的摘要信息将通过对航班延误、特定地区的天气状况、时刻表变更等的及时修正来相关。

价值。价值。数组本身不携带任何特殊值。仅当经过处理和分析后,可以得出具体结论以做出明智的决策时,信息才有用。例如,开发优化的城市交通物流系统。

让您的利润增加10倍:您必须跟踪的5个关键指标
亚历山大·库列绍夫
亚历山大·库列绍夫
销售发电机有限责任公司总经理
在我的个人博客上阅读更多帖子:

在与300多个互联网项目合作之后,我可以保证:每周监控这些指标,你的公司不仅会生存,而且利润会增加10倍!

在制裁和危机的情况下,了解广告的投资回报率决定了您的业务是否会成功。跟踪这 5 个关键指标是您繁荣的关键。

您将免费获得什么:


5大关键指标利润提升220%


原生广告秘方:如何在30天内将品牌知名度提升40%


杀手级销售提案模板,可将交易转化率提高 60%

我们为您准备了所有带有公式的文档和模板。是的,它是免费的:

免费下载文档
已下载
152974

根据处理程度,大型数据库可以是:

结构化。数据根据某些样本进行分组。例如,医学中使用的大数据技术允许您根据接受治疗的患者的体温、血压和其他重要参数对信息进行排序。

部分结构化。阵法的某一部分还处于混乱状态,需要仔细处理。示例:某个地区某段时间内的紧急情况数据库。

非结构化。通常给出社交网络用户发布的一组文件(照片、音乐、剪辑等)的示例。

大数据选项

资料来源:shutterstock.com

大数据和传统数据库之间还有另一个根本区别。其原因在于,由于分布式结构,可以使用许多微服务来管理信息阵列。它的工作原理就像一个复杂的过滤器。提供一系列不同的信息作为输入,结果,必要和有用的信息的集中片段结晶。

如果这一过程中只有一个来源,那么处理将很快且毫无困难地进行。但随着来自不同地方的巨大信息流,传统工具可能无法应对如此庞大的信息量。因此,设计了专门的服务来显着加快大型数据库的工作速度。
Post Reply