我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:六合图库 > 多数据 >

本讲认为大数据并不意味着数据越多越好要以是否什么为标准

归档日期:07-03       文本归类:多数据      文章编辑:爱尚语录

  举例而言,医学应用上研究心脏疾病,想知道病人怎么做才能更加健康,于是搜集大数据。但一个人每天产生的各类数据是海量的,大量的数据跟病理反应本质上毫无关系,你去搜集、去分析,不但做了无用功,还可能得出错误的分析结论。一个反面案例是,在美国拉斯维加斯的赌场,红黑转盘边都用一个大屏幕显示之前的开奖信息。很多人看着前面出现“红色”次数较多就下注“黑色”,这就是典型的“数据噪声”——搞统计的都知道,这完全是随机的,这些所谓的“大数据”是无效的甚至干扰的。“开展大数据分析一定要有‘应用场景’,讲求数据的精准性和关联度,数据本身的‘大’或‘小’并不是关键。” 凌晓峰说,盲目追求数据之大,产生不了“有用的结果”,反而容易“自我迷惑”,这也是当下大数据产业存在的普遍误区。这一观点有极强的现实针对性。当下,不少制造企业言必称“大数据”,无论搞什么产品,都接入光纤,加上传感器,每时每刻产生一大堆“数据”。问题在于,数据有了,但哪些有效哪些无效,无从辨别。不但造成硬件设备和统计计算资源的浪费,还可能因“数据噪音”的干扰得出错误结论,反而削弱市场竞争力。“我们把大而无当的数据称作‘低价值密度’的数据。”中国工程院院士谭建荣告诉记者,以前专业术语就叫“数据挖掘”“数据分析”,现在为何要给数据加上“大”的前缀?在他看来,所谓的大,一是强调数据的时效性,以前数据报表都是延时的,新的物联传感技术手段提供的数据更实时,也更有价值。二是强调关联化。他调研发现,长三角企业推进信息化,普遍采用生产管理软件。但这些通用软件数量多达几十上百种,不同软件产生的数据是不共享的。如果产生不了关联效应,再多的数据都只能算是“小数据”。三是要强调“个性化”。数据模型越大,越能得到个性化的特征,如何将客户模糊的个性化需求数据转化为设计技术指标,将是工业大数据应用的下一个“风口”。

  “大数据真正要义不在于大,而在于多元。”大数据产业大咖、零点研究咨询集团董事袁岳说,如何使多元数据在汇聚的过程中,通过软件处理最终得到科学的分析结果,变成有用的数据源,这才是生产制造和社会管理领域建立大数据决策系统的意义。“就像挖矿过程中,大数据是其中的原油,只有经过精细的提炼变成精数据才有价值。”

  一场“头脑风暴”,历时三四个小时。唇枪舌剑中,一项项共识逐渐成型——大数据≠“大”的数据;大数据产业发展要“应用导向”;数据将是未来发展最重要的资源,甚至“驱动未来”……

本文链接:http://lcvam.com/duoshuju/635.html