大数据、数据挖掘和机器学习:为业务带来价值
2017-09-08 湾区城市群
行业专家称,“藏在大量数据中的知识就是可以改变世界。”
人们目前生活在一个后现代世界,在这个时代,技术、数据和信息统治着世界。因此,人们很容易相信大数据概念是一个独特的现象,从2012年开始,当时的美国总统奥巴马政府宣布了大数据研究和开发计划。
然而,自1991年互联网得到迅速发展以来,大量的数据一直存在。当时与现在的根本区别是,人们解析这些数据量的能力已经发展到现在可以将这些数据作为人们的业务决策过程的一部分。
大数据和数据挖掘:收集正确的数据
当焦点首先从数据存储转移到大数据的价值时,很容易收集和存储尽可能多的数据,以便尽可能在将来某个时候使用该业务。
然而,这一焦点现在已经从简单的数据收集转移到相关数据的收集;为业务增加价值的数据。只有收集大量的数据是不够的。大规模地收集数据会给人们带来大量数据;因此,有大量的数据;但这并不一定意味着拥有有价值的数据。
有用的数据不仅需要大数据,还需要高质量,实用的信息。换句话说,企业需要收集关于每个主题的数据,这些数据足够详细,以便分析工具和模型可以根据需要深入细节。
这是数据挖掘的地方。本质上,数据挖掘是用于对大型数据集进行排序以识别模式和关系的方法。然后将这些模式和关系用于解决问题并预测未来趋势。
一旦原始数据被提取,转换和加载到数据仓库中,才执行数据挖掘方法。
数据挖掘和机器学习:构建预测模型
WhatIs.com的Margaret Rouse将机器学习定义为“人工智能(AI)”,允许软件应用程序在未明确编程的情况下更准确地预测结果。
其主要宗旨是基于可以查看输入数据并使用统计分析来根据输入数据预测趋势和值的算法。机器学习模型是关于逻辑和我们做事情的方式。
推荐引擎
最简单的机器学习模型之一是推荐引擎。然而,在我们看看推荐引擎的工作原理及其作为业务预测模型一部分的有效性之前,我们来看看什么是机器学习。
如上所述,推荐引擎是一种简单的预测软件模型,其尝试预测用户将给予项目的评级。推荐引擎最知名和最实用的用途之一是将其并入电子商务购物平台。
例如,如果户外装备网站的访问者点击一条徒步旅行裤,推荐引擎将推荐可以与所选择的徒步旅行裤一起佩戴的其他装备和服装。
推荐引擎如何知道要选择什么?嗯,可以查看客人所看的裤子的款式,预测网站用户会购买的衣服的样式,并显示一个徒步旅行裤相匹配。
提出的问题是,推荐引擎如何知道提供额外的服装?答案是既简单又复杂。从本质上讲,预测模型是合乎逻辑的;因此,它使用统计分析来建立用户角色模型,包括每个访问者对网站的服装风格和颜色的喜好。
结语
大数据(及其相关的方法)目前正在并将继续发挥作用,在预测和预测趋势方面发挥越来越重要的作用。因此,企业利用其决策权在消费者购买浪潮的最前沿获得最佳机会。