IT和分析经理认为机器学习应用程序的最大挑战,包括数据准备和开发算法驱动的分析模型。
几十年来,机器学习已经成为高级分析场景的一部分,但是大数据平台和创建自动分析算法工具的出现使得机器学习变得更加重要。因此,越来越多的IT和分析团队面临着来自机器学习项目的挑战。
在许多组织中,机器学习计划需要在IT基础设施上进行大规模投资,往往涉及到Hadoop集群,Spark处理引擎和其他大数据技术的部署。新的数据管理和分析过程往往还需要准备数据集进行分析,并开发算法实现数据运行。在许多情况下,这意味着要通过外部招聘或培训现有员工增加新的技能。
所谓深度学习应用程序,就是将人工智能与机器学习相结合,使组织能更好地应对更复杂的分析工作。例如,中国直播网 ,解释图像信息以便更好地按照内容分类。需要强调的是,深度学习加大了数据科学家和统计学家通过自动算法建立预测模型的开发难度。
在2016年Hadoop峰会上,一些与会者分享了他们在机器学习项目中遇到的最大挑战,其中包括前期数据准备工作的复杂性和使用机器学习算法库作为模型开发过程的一部分。
可穿戴相机制造商GoPro的数据科学与工程高级经理Chester Chen表示:“最大的挑战是准备数据。所有这些数据以不同形式进入,在正确的数据管道获取正确的数据是一个相当艰巨的任务。”
移动和IoT分析服务提供商Webtrends公司首席技术官Peter Crossley分享了自己的体会:“获取以某种形式进行清理或管理的数据比较困难。你必须有一个规范化的数据集——可以在数据湖转储所有数据,但是数据沼泽很难进行分析。”
创新制药公司工程总监Murali Kaundinya说道:“数据分析师不想处理所有机器学习库。最大的挑战是为他们提供一个平台,即使他们没有成为机器学习方面的专家也可以使用这个平台。”
美国德克萨斯大学MD安德森癌症中心分析主管Bryan Lari认为:“你从不精确的数据开始分析,所以当它达到了足够高的数据精度,你也会相信你得到了准确的结果。”
雅虎云计算和大数据平台高级主管Sumeet Singh表示:“我们必须让它变得更加简单。在做任何事情之前,中国直播网,数据科学家可以花一个月或两个来评估一个特定的库。这的确是一个障碍。”
特别声明:本文为中国直播网直播号作者或机构上传并发布,仅代表该作者或机构观点,不代表中国直播网的观点或立场,中国直播网仅提供信息发布平台。
版权声明:版权归著作权人,转载仅限于传递更多信息,如来源标注错误侵害了您的权利,请来邮件通知删除,一起成长谢谢
欢迎加入:直播号,开启无限创作!一个敢纰漏真实事件,说真话的创作分享平台,一个原则:只要真实,不怕事大,有线索就报料吧!申请直播号请用电脑访问https://zbh.zhibotv.com.cn。