文章正文
物联网趋势与数据科学自动化

发布时间:2017-05-02

  数据科学是对大数据或物联网(IoT)环境进行的任何分析练习的核心。数据科学涉及广泛的技术,业务和机器学习算法。数据科学的目的不仅是做机器学习或统计分析,而且还可以从没有统计知识的用户理解的数据中得出洞察。

  在诸如大数据和物联网等快节奏的环境中,数据类型可能随时间而变化,变得难以每次都维护和重新建立模型。这个差距需要一种自动化的方式来管理这些环境中的数据科学算法。数据科学的兴起旨在将我们从基于规则的系统转移到机器自身学习规则的系统中。机器学习使数据科学固有地部分自动化。需要手动干预的数据科学的一半仍然是自动化的。然而,这些领域涉及到人们的经验和智慧:数据科学家,商业专家,软件开发人员,数据集成商,目前有助于使数据科学项目运作的人。这使得数据科学的各个方面都难以实现自动化。但是,我们可以将数据科学自动化视为两级架构,其中:

 不同的数据科学学科/组件是自动化的

所有单独的自动化组件都是互连的,以形成一个连贯的数据科学系统

  我们可以将数据科学系统视为自动化,只要它们足够能够在我们抛出数据集时解决我们的问题。此外,应该足够聪明地向我们提供我们可以理解的语言中的所有可能的解决方案。

  数据准备,机器学习,领域知识和结果解释是成功执行数据科学项目所需的四个主要任务。所有这些任务都必须转换为自动化模块,以创建一个自动化的数据科学系统(图1)。

物联网趋势与数据科学自动化

 数据准备自动化

  数据准备是每次创建模型时必须完成的重复任务。数据提取,数据清理和数据转换(例如估算空值和算法特定转换)是属于此类别的一些任务。许多组织将这些任务自动化,并将引擎标记为数据科学自动化工具。但是,大多数这些工具使用基于规则的逻辑来自动执行数据预处理任务。这是正确的做法吗?我们是否需要基于规则的系统来自动化数据科学,这是终止基于规则的系统诞生的?不,我们需要通过机器学习自动进行数据预处理。例如,关于什么预处理功能必须应用于问题的数据的决定是由机器本身做出的。

  特征工程是需要自动化的另一个数据准备领域。特征工程是将原始数据转换为属性/预测变量的技术,可提高机器学习项目的准确性。特征工程自动化仍处于初级阶段,也是一个积极的研究领域。麻省理工学院的数据科学家正在开发一种能够从原始数据生成特征的“深度特征综合”算法取得了令人难以置信的进步。

自动机器学习/统计

  这是统计程序自动化的数据科学自动化领域。系统根据提供的数据集执行最佳算法。它隐藏了用户的复杂性和算法的数学复杂性,使其向群众提供。用户需要向自动统计学家提供数据。它了解数据,创建不同的数学模型,并根据最能说明数据的模型返回结果。自动统计学家是一个复杂的科学,因为它需要系统学习输入数据模式,找到最佳拟合值,并使用几种统计和机器学习算法自我优化其参数。这需要各种算法约束的推广和巨大的计算能力。

  通过利用基于云的服务器来管理高计算能力的需求,自动机器学习逐渐成熟。创建数据产品的组织逐渐包括诸如元学习的功能,基于数据集的元数据自动选择合适的机器学习算法的过程。像H2O.ai这样的组织通过引入几个内置功能来推广模型构建过程,并提供了许多模型调整选项,可以更好地控制算法。此外,他们已经将超参数调优作为几乎所有算法的特征,使数据科学家免于使用不同参数测试模型的繁琐过程。超参数调整是使机器学习模型重新运行多次的自动化尝试和错误的过程,以确定数据集上的模型的适当参数。

洞察产生自动化

  数据科学项目的结果直到和除非业务用户或没有统计知识的观众理解它才有用。数据科学活动的奶油是讲故事的部分,数据科学家以全面透明的方式向人们解释结果。自动化此任务需要从统计学家友好的结果自动生成用户友好的文本。自然语言生成(NLG)是当前的前沿框架,可以帮助将语言翻译成自然语言。 Nlgserv和simplenlg是我们可以用于此任务的两个NLG框架。此外,我们可以使用马尔科夫链自动生成句子和制作故事。

  数据科学自动化的创新已经开始,并将在未来几年逐渐演变。我们目前正处于一个阶段,我们已经开始处理个别数据科学模块的自动化。从这里,我们需要转移到更通用的数据科学平台,所有模块都自动化并集成在一起。这是一个变化的开始,就像房间大小的计算机被转换为信用卡大小的计算机一样。

  • 观众报名
  • 申请展位
展会资讯 更多 >>

必看!本届最全AGIC+ 参观指南出炉!一年一次,我们8月28日不见不散!

41%的市场占比背后,我们更关注LoRaWAN的什么价值!

超全参会攻略!8月28日AGIC 2024深圳(国际)通用人工智能展不见不散

全球最大AI+ 即将开展,参展商名录曝光!建议收藏!

未来视界,触手可及 —— 电子纸生态专区企业大揭秘

展商资讯 更多 >>

并行科技邀您共聚2024AGIC深圳(国际)通用人工智能产业博览会

领驭科技将亮相AGIC深圳(国际)通用人工智能产业博览会,“瀚鹏AI”打造企业新质生产力

【IOTE】专注大中功率RFID读写器的推广—上海舜识将亮相IOTE国际物联网展

【IOTE】RFID智能硬件识别解决方案商—瑞弗艾迪将亮相IOTE国际物联网展

【IOTE】国内定制化物联设备与特种电子标签先驱品牌——鼎界物联将亮相IOTE国际物联网展

【IOTE】物联网应用专家—罗维尼科技将亮相IOTE国际物联网展

【IOTE】平头哥邀你相聚2024IOTE国际物联网展·深圳站

【IOTE】以位置服务为中心的物联网芯片及解决方案供应商—芯与物将亮相IOTE国际物联网展

【IOTE】专业天线服务厂商,一站式RFID方案解决商-东振技术将亮相IOTE国际物联网展

【IOTE】致力于有机半导体材料和器件的研发与商业化—追光科技将亮相IOTE国际物联网展

行业资讯 更多 >>

36亿定增计划终告吹,所为何因?

又一个全球鞋类品牌开始使用RFID

千帆星座计划升空,目标实现“永不失联”

RFID标签持续增长的动力在哪里?

边缘计算热潮之下,边缘AI芯片何以独领风骚?

芯动联科上半年营收增长超40%,定点智能驾驶客户,市场放量蓄势待发

凭什么扫地机器人出海遍地开花?

老石旦煤矿如何实现智能化与安全双重飞跃!

数字车钥匙:NFC/BLE是主力,UWB/星闪正登场

RFID算不算一个赚钱的行业

粤ICP备05006090号-11版权所有©IOTE 物联网展始于2009 | 深圳市物联传媒有限公司
首页 观众报名
关于展会
联系我们

微信扫码
注册展会VIP观众

服务热线

18676385933

在线咨询

回到顶部

Baidu
map