博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
五大尴尬掣肘大数据
阅读量:7048 次
发布时间:2019-06-28

本文共 853 字,大约阅读时间需要 2 分钟。

云计算是大数据的运行平台,非结构化数据爆发式成长,大数据的智能分析和决策被粉饰的神乎其神,不过针对应用领域,还有四个要素将影响大数据发展:

1.预测后不敢用

如果把大数据比作算命显然有点欺负了这位IT新宠,但从目前的大数据分析领域看,在很多行业应用上还存在敢测不敢用的尴尬,预测结果更多是印证而不是代替决策,除了大数据本身预测准确率以外,系统性风险带来的决策失误很可能最终让大数据背锅,信息部门以及咨询机构凭空担了责任,想想就觉得冤枉。

2.信息不对称

大数据体现在一个大字上,是一个公司的数据还是一个行业的数据还是合纵连横参考多个维度数据来做的最终分析?实际上各个“大数据库”如一个个信息孤岛,彼此缺乏联动,而单一通过某个孤岛来决策自然生态显然是盲人摸象,不准也就不足为奇了。

3.非结构化难解人性

结构化数据的最大特点是基于考量数据做推演,总结过去做预测,可当前大数据面临太多的非结构化数据,这里包含了庞杂的社会信息和干扰信息,如果我们按照结构化数据的方式来看,从过去10年情况来预测今年的走势,也许会得到一个波动不太大的结果,但如果我们发现某位用户衣服买了绿色,裤子买了绿色,衬衫买了绿色,然后系统认为用户在服饰选择上偏爱绿色的话,那有一天用户想买顶帽子时,系统推荐的商品也许会激怒用户。

这应该是大数据面临最尴尬的一点,如果说大数据是基础,深度学习和人工智能才是关键,因为这两项必须依靠大数据作为基石,会让决策准确度实现指数级提升,当这两项技术水平得到了解放,大数据才完整体现了价值。

4.使用过期数据

数据的新鲜程度将极大影响最后的分析结果,不同的行业的数据保鲜时间也会有很大差别,例如服装业的潮流变化速度明显快于其他行业,很多大数据最终结果偏差都是由于数据更新的不及时性导致,因此如何确保数据不断随时更新对于大数据来言是一个很大的挑战。

5.走不出安全隐私困局

安全是一个永久话题,数据越多,泄露后带来的风险和损失越大,“大数据库”越大,一锅端后看着越辣眼睛。

本文作者:佚名

来源:51CTO

转载地址:http://vrcol.baihongyu.com/

你可能感兴趣的文章
数据结构与算法 | Leetcode 141:Linked List Cycle
查看>>
推荐给新手的35个好用的Vue开源库
查看>>
简述原型链是什么,有什么用处?若想访问一个对象的原型,应该使用什么方法?...
查看>>
[LeetCode] 675. Cut Off Trees for Golf Event
查看>>
SQLServer之锁简介
查看>>
从点餐小程序说起,谈谈如何从0到1设计一款toB类产品
查看>>
CSS相对定位和绝对定位
查看>>
断开TCP连接
查看>>
我的前端集成测试(一)- 认识node的assert模块
查看>>
【跃迁之路】【465天】程序员高效学习方法论探索系列(实验阶段222-2018.05.16)...
查看>>
spring4.x 集成quartz2.x 集群化配置项目实例
查看>>
Spring Boot 参考指南(开发者工具)
查看>>
TypeScript 2.9
查看>>
Linux 程序包的管理
查看>>
JavaScript 异步、栈、事件循环、任务队列
查看>>
图解 React Virtual DOM
查看>>
Day08 - HTML5 Canvas 实现彩虹画笔绘画板指南
查看>>
Spring Boot [组件学习-Spring Data JPA]
查看>>
百度云磁盘CDS、对象存储BOS技术深度解析
查看>>
Deno:来自Node之父的V8 TypeScript运行时
查看>>