第七百八十一章 远大理想-《大国重工》


    第(2/3)页

    得到冯啸辰的夸奖,姚富杰更来劲了,他说:“后来,我去找了包成明叔叔,他手里有一个非常大的数据库,记录了全国几百万家企业的资料,我现在正在对这些资料做分析,看看能不能分析出一些名堂来。”

    “你是说,你的兴趣是在分析数据上?”冯啸辰问。

    姚富杰说:“我做的可不是简单的分析数据,我做的这种工作,现在在国外特别流行,叫做Data_mining,翻译过来就是数据挖掘。它和传统的统计分析不是一回事,最大的区别就是它是针对海量数据的分析,所有的分析模型都是通过机器学习完成的。”

    冯啸辰哑然失笑了,数据挖掘技术时下在国内还不太受到重视,但国外的确已经应用得非常广泛了。再过十几年,这种技术会以一个更接地气的名字在国内出现,并且迅速泛滥成灾,许多互联网公司都以应用这种技术为荣。这个更接地气的名字,就是“大数据”。

    大数据分析其实并没有什么神秘的,不过就是在海量的数据中寻找相似的模式。由于数据量极大,可能存在的模式也数不胜数,靠人力去识别这些模式是不可能的,只能通过计算机来自动识别,这其中就涉及到人工智能、机器学习、神经网络之类的知识。对于外行来说,这些知识是非常玄妙的,但对于内行而言,不过就是一些套路而已。

    大数据分析的价值是毋庸置疑的。在营销中,通过大数据分析,能够在海量数据中找到不同的用户行为模式,可以对用户进行精准营销,从而有效地提高营销效率、降低营销成本。在生产上,大数据分析能够优化生产调度,及时发现生产中的问题,识别故障,是实现智能生产的重要前提。

    当然,在后世,有许多打着大数据分析旗号的研究,其实并不是真正的大数据分析,而只是传统统计分析方法在海量数据库中的应用,使用的依然是求均值、求方差、解线性回归之类的传统算法,并没有进行模式识别的能力。这种所谓的大数据分析大行其道,倒让真正的大数据分析被人误解了。

    “富杰,你在大学是学什么专业的,怎么会做Data_mining?”冯啸辰好奇地问。

    姚富杰说:“我学的是工业自动化,不过我更喜欢的是数学和计算机,在大学里选修了这方面的课程。我还有几个计算机系的朋友,他们在这方面的能力更强。我说的那些模型就是他们帮忙做出来的,光靠我一个人可搞不出来。”

    “这么说,你的理想就是开一家专门做数据挖掘的公司?”冯啸辰试探着问道。姚富杰说了这么老半天,当然不会是无的放矢的。

    姚富杰反问道:“冯叔叔,你觉得可以吗?”

    “当然可以。”冯啸辰不假思索地答道。开玩笑,数据挖掘也算是面向21世纪的朝阳产业之一了,看看后世那些搞大数据的何其风光。姚富杰和他的那几位朋友如果能够从现在就开始进入这个领域,熬上十几年,等到大数据业务全面开花的时候,他们差不多可以算是业界权威了,那是可以参加西湖论剑的好不好?

    姚富杰面有喜色,说:“这么说,冯叔是支持我的?”

    “这个可不好说。”冯啸辰故意装出一些为难的样子。

    “为什么?”
    第(2/3)页