详解AI领域“金发女郎效应”:如何让应用型AI做到刚刚好?


 编者注:强人工智能(Strong AI)又称通用人工智能(Artificial general intelligence)或完全人工智能(Full AI),指的是可以胜任人类所有工作的人工智能;弱人工智能(Weak AI)也称限制领域人工智能(Narrow AI)或应用型人工智能(Applied AI),指的是专注于且只能解决特定领域问题的人工智能。

虽然埃隆·马斯克(Elon Musk)和马克·扎克伯格一直在争论AGI(通用人工智能,又称强人工智能)的危险,但初创公司只是将人工智能应用于解决特定领域问题,例如提升销售团队的绩效以及提高生产线的运营效率,这些创企逐渐成长为估值数十亿美元的企业。然而,严格的定义问题只是找到有价值的人工智能商业应用的第一步。

为找到构建人工智能业务的合适机会,初创公司必须在不同的维度上运用“金发姑娘原则”,以找到“合适”开始的甜蜜点(sweet spot)——在不同维度之间注意平衡,切记不可过分专注一个维度。根据我们从与数千家AI创企合作中学到的知识,以下是一些有抱负的创始人结合自己的人工智能策略寻找甜蜜点的一些方法。

“恰到好处”的预测时间范围

与市面上其他智能软件不同,人工智能会响应其运行的环境;算法接收数据并返回一个结果或预测。根据应用程序的不同,可以对近期的情况进行预测,例如明天的天气,也可预测出未来许多年的结果,比如患者是否会在20年内患上癌症。算法预测的范围对其有效性以及是否提供构建防御性的机会而言至关重要。

针对一个较长的时间段进行预测的算法很难做出评估和改进。例如,算法可以使用承包商之前项目的时间表预测某个建筑项目将比计划落后6个月并超预算20%。在新项目完成之前,算法设计者和最终用户很难对此预测做出评论,只能判断预测内容在方向上是否正确——即项目是否延迟完成或成本是否更高。

即使最终的项目编号最终非常接近预测的数字,也很难完成反馈循环并积极地加强算法。许多因素会影响到复杂的程序,如建筑项目,因此很难利用A/B测试预测来梳理未知混杂因素的输入变量。系统越复杂,算法完成加固循环所需的时间越长,精确训练算法也就越困难。

虽然很多企业客户对使用AI解决方案持开放态度,但为了完成销售,初创公司必须能够验证算法的性能。验证算法最有说服力的方法就是借助客户的实时数据,但这种方法在试点期间可能很难实现。如果创企可获权访问客户的数据,预测时限应该尽量短一点,以便在试验期间验证算法。

对于大多数AI创企而言,较慢的计算速度严重限制了应用型人工智能的范围。

历史数据(若可用)可以作为训练算法的权宜之计,并通过回溯测试暂时验证它。训练对历史数据进行长时间范围预测的算法是有风险的,因为过程和环境更有可能改变你对历史记录的了解,从而使得历史数据集对当前条件的描述性减弱。

其他情况下,虽然描述结果的历史数据可用于训练算法,但可能无法捕获在考虑范围之内的输入变量。举个建筑行业实例,你发现使用蓝色安全帽的建筑工地更有可能按时完成项目,但由于帽子的颜色在之前并没有对管理项目带来任何帮助,该信息未记录到存档文件中。所以必须从头开始捕获这些数据,这将再度推迟企业的上市时间。

AI创企应该建立多种算法,以较短的范围进行更小、更简单的预测,而不是在长时间范围内进行单一的“hero”预测。将运行环境分解为更简单的子系统或在过程中限制数据的数量,使其更容易控制混杂因素。Autodesk的BIM 360项目IQ团队将这种小型预测方法应用于建筑行业,消除了施工过程中的众多低效问题,并有助于消除潜在的设计与施工风险。其算法模型可预测安全性,并对供应商和分包商的质量/可靠性进行评估,所有数据都可以项目进行周期中进行测量。

较短的时间范围便于算法工程师监控其性能变化并采取措施快速改进,而仅限于对历史数据进行回溯测试。时间范围越短,算法的反馈回路越短。每个周期做出的反馈逐渐累加,可增强算法的性能,较短的反馈周期更有利于构建防御性。

“恰到好处”的可操作窗口

大多数算法对动态系统进行建模并返回一个预测结果供人类采纳。由于系统更改频繁,算法的输出很难在长时间内保持有效性:很可能在用户采取行动之前,预测结果的有效性就大幅度“下降了”。为保证预测结果对最终用户的有效性,必须设计算法以适机器与人类速度的限制。

在典型的人工智能工作流程中,人类将数据输入算法中,算法运行、计算输入数据,并输出预测结果或建议行动步骤;人类解释该信息以决定行动方案,然后采取行动。算法计算结果所花费的时间以及人类对输出内容进行操作所花费的时间是此工作流程中最大的两个瓶颈。

对于大多数AI创企而言,较慢的计算速度严重限制了应用型人工智能的应用范围。算法的预测取决于输入数据,输入数据代表记录过程的瞬时数据。如果数据描述的环境变化快于算法计算输入数据的时间,则在算法完成其计算并返回预测时,预测结果仅适用于过去的某个时刻,并且将不可操作。例如,音乐程序Shazam后台的算法在首次“听到”歌曲到识别这首歌,期间可能需要花费好几个小时,且需借助Windows 95系统的计算能力。

云计算的兴起以及专为人工智能计算而优化的硬件开发极大地拓宽了应用型人工智能可行且可负担的领域。虽然宏观技术的进步极大地推进了应用型人工智能,但算法并不完全受制于当前的计算限制;通过训练加强也可以改善算法的响应时间。算法遇到的相同示例越多,就能越快地跳过计算过程得出预测结果。由于计算的加强与改善,如今Shazam仅用不到15秒的时间便可识别一首歌。

自动化决策和操作还可以帮助用户利用因过快失效而等不及人类做出回应的预测。Opsani就是这样一家企业,它运用人工智能来做出数量庞大、快速变化的决策,以便人类有效采用。与人类DevOps(DevOps,即Development和Operations,是一组过程、方法与系统的统称,用于促进开发应用程序/软件工程、技术运营和质量保障部门之间的沟通、协作与整合)不同,人类DevOps只是根据算法的建议快速地优化性能,Opsani则是应用人工智能来识别和自动改进应用程序和云设施的操作,以便用户享受到更好的性能。

然而,并非所有人工智能应用都可以完全自动化,如果感知风险对于最终用户来说太高而无法接受,或者法规要求必须有人类来批准该决策等情况下,人工智能应用便无法完全自动化。

“恰到好处”的性能最低限度

就像软件创企会选择在开发了最小可行产品(MVP)以便从初始客户中收集可采取措施的反馈时进入市场,AI初创公司应该在达到早期用户所需的最低算法性能(MAP)时正式进入时市场,在市场的大环境下,算法可以接受更多样化和新鲜数据集的培训,也可避免过度训练变成数据集。

大多数应用程序并不需要达到100%准确,也会有一定价值。例如,欺诈检测算法可能只会在发生故障后的24小时内立即捕获5%的欺诈案例,但诈骗调查人员经过一个月的分析也仅能捕获15%的案例。在这种情况下,MAP为0,因为欺诈检测算法可以用作第一过滤器,以减少调查人员必须经手的案例数量。该创企可立即进入市场,以确保访问用于培训其算法的大量欺诈数据。长此以往,算法的准确性必将能提高并减轻调查人员的负担,使其能专注于更复杂的案例。

为0或较低的MAP应用程序构建算法的初创公司将能快速进入市场,但若是算法达到高水平性能之前出现这些副本,则可能需要不断调查跟风抄袭的企业。

将算法从研究实验室转向市场并没有通用的方法。

专攻较低MAP问题的初创公司也应注意那些可通过非常小的训练集以近100%准确度解决的问题,其中建模的问题相对简单,跟踪的维度少,结果可能出现的变动也比较少。

基于AI的合同处理是算法性能迅速提升的应用一个很好的例子。合同类型数以千计,但大多数的关键板块都是类似的:涉及的各方、交换价值的项目、时间框架等。抵押贷款申请或租赁协议等特定文件类型是高度标准化的,以符合监管。在多个初创公司中,我们发现自动处理这些文档的算法在其他示例未帮助改进之前,只需要几百个示例就可训练到可接受的准确度,从而使后来者更容易将现有企业和早期算法性能进行匹配。

针对劳动力低廉且能够轻松达到高精度的应用领域而设计的人工智能需要在找到早期用户之前达到更高的MAP。例如,需要精细运动技能的任务尚未被机器人接替,人类的表现需要了非常高的MAP来克服。拾取物体时,为机器人手提供动力的人工智能必须以高精度测量物体的硬度和重量,否则机器人手会损坏被处理的物体。而对人类而言,无需任何训练,也能非常准确地测量这些尺寸。攻击高MAP问题的创企必须投入更多时间和资金来获取足够的数据,才能达到MAP并正式进入市场。

克服困难

在研究实验室中,限制领域人工智能(Narrow AI)可以在广泛的应用中取得了重大进展。此外,围绕Narrow AI的应用程序建立业务需要新的算法集。此过程很大程度上取决于所有维度的特定用例,算法的性能只是一个起点。将算法从研究实验室转移到市场并没有通用的方案,还得具体问题具体分析,但希望这些想法能够为你提供一个拥有的蓝图。


发表回复