人们需要了解采用人工智能的挑战,例如数据、人员和业务。
人工智能正在进入更多的行业,越来越多的公司已经体验到了实施人工智能的好处。尽管人工智能正在发展并越来越受欢迎,但许多企业仍然无法采用这种新技术改进业务。这是为什么?
企业可能担心人工智能实施的原因有很多。在2019年,O'Reilly公司出版了一本电子书,总结了对企业采用人工智能的调查结果,并列出了阻碍进一步实施人工智能的一些最常见因素。
23%的受访者表示,他们没有进一步采用人工智能的主要原因是他们的公司文化不认可对人工智能的需求。其他原因包括缺乏数据和缺乏技术人员,以及难以确定适当的商业案例等。
企业在实施人工智能时面临哪些挑战?
正如人们所见,一些常见问题主要包括与人员、数据或业务一致性相关的问题。虽然每家公司都不同,并且也会以不同的方式体验人工智能的采用过程,但也应该注意一些障碍。在本文中,将介绍人工智能实现中最常见的一些挑战,并尝试建议如何做好应对这些挑战的准备。
与数据相关的问题可能是大多数企业所面临的问题。众所周知,企业构建的系统只能与它给出的数据一样好。由于数据是人工智能解决方案的关键要素,因此在此过程中可能会出现许多问题。
1.数据质量和数量
如上所述,人工智能系统的质量在很大程度上依赖于输入的数据。人工智能系统需要大量的训练数据集,以类似于人类的方式从可用信息中学习,但为了识别模式,它需要更多的数据。
在任务上做得更好,执行任务的经验越多,这是有道理的。不同的是,人工智能能够以人类想像不到的速度分析数据,因此其学习速度很快。企业给它的数据越好,它将提供更好的结果。
那么企业怎么解决数据问题?首先,需要知道已有的数据,并将其与模型所需的数据进行比较。为此,企业需要知道其将要使用的模型,否则,将无法指定所需的数据。
列出企业拥有的数据的类型和类别问题:数据是结构化的还是非结构化的?是否收集有关客户人口统计数据,购买历史记录,现场互动等数据?当企业知道其已经拥有的东西时,会看到所缺少的东西。
缺少的部分可能是人工智能系统可以轻松访问的一些公开信息,或者企业可能必须从第三方购买数据。某些类型的数据可能仍然难以获得,例如临床数据可以更准确地预测治疗结果。不幸的是,在这一点上,企业必须做好准备,不是所有类型的数据都容易获得。
在这种情况下,综合数据得以拯救。综合数据是基于实际数据或从头开始人工创建的。当没有足够的数据可用于训练模型时,可以使用它。获取数据的另一种方法是使用开放数据作为数据集的补充,或使用谷歌数据集搜索获取数据来训练模型。企业还可以使用RPA机器人来抓取公开可用的数据,例如维基百科网站上发布的信息。
当企业知道自己拥有哪些数据以及需要哪些数据时,将能够验证扩展数据集的哪种方式最适合自己。
2.数据标签
几年前,大多数数据都是结构化的或文本的格式。如今,随着物联网(IoT)的发展,大部分数据都是由图像和视频组成的。这没有什么不对,但问题是许多利用机器学习或深度学习的系统都是以监督的方式进行训练,所以他们需要对数据进行标记。
事实上,人们每天产生大量数据的事实,已经达到了没有足够人员来标记正在创建的所有数据的程度。有些数据库提供标记数据,包括ImageNet,这是一个拥有1400多万张图像的数据库。所有这些都是由ImageNet人工注释的。尽管在某些情况下其他地方可以获得更合适的数据,但许多计算机视觉专家仍然只使用ImageNet,因为他们的图像数据已被标记。
企业可以采用一些数据标注方法。可以在企业内部或外包工作,也可以使用合成标签或数据编程。所有这些方法各有利弊。
3.可解释性
对于许多“黑盒”模型,企业最终得出一个结论,例如预测但没有解释。如果人工智能系统提供的结论与企业已经知道的结果重叠并认为是正确的,那么就不会质疑它。但是如果不认同会发生什么?需要知道如何做出决定。在许多情况下,其决定本身是不够的。医生不能完全依赖系统提供的关于患者健康的建议。