现实世界的自动控制系统的设计需要进行各种工作,从调节摩天大楼的温度到在街上的小部件工厂中运行小部件制造机器,都需要基于物理的复杂建模方面的专业知识。据数据科学家称,对这种建模专业知识的需求增加了运营成本,并限制了自动控制在系统中的适用性,在这些系统中,边际运行性能的提高会带来巨大的经济利益。
工程师可以不受限制地访问超级计算机和大量数据,可以训练 人工智能 系统(例如深度神经网络)(一种机器学习模型)来执行自动控制。但是,许多人无法获得必要的计算能力,也无法生成训练具有深层神经网络的控制器所需的数据量。
而且,这些类型的深度神经网络是所谓的黑盒模型,这意味着它们用于决策的因素对最终用户是隐藏的。
除缺乏可解释性外,标准深层神经网络的行为难以认证,这妨碍了它们在必须保证控制器的安全性和性能的应用中的使用,”美国西北太平洋地区数据科学家Aaron Tuor解释说。 华盛顿里奇兰的实验室(PNNL)。
“我们正在尝试将基于深度学习的建模引入更有效的数据机制,使其能够在实际应用中使用,这可能需要可解释性和黑盒深度学习建模无法保证的操作保证要约,”他说。
安全高效的自动化控制
Tuor和他的同事正在开发一种用于设计自动控制器的方法,该方法利用深度学习 和控制理论的进步 来嵌入要控制系统的已知和未知物理。
这种混合方法有望将安全有效的深度学习自动化控制技术引入更广泛的工业和工程系统,例如建筑能源系统优化,固相处理以及无人驾驶飞机和水下车辆。
将系统的已知物理特性嵌入控制器,使其适用于对性能保证至关重要的应用。Tuor补充说,该方法克服了对用于控制关键系统的黑盒机器学习模型的可靠性的担忧。
他说:“如果您处在一个不能让深度学习做出任何决定的操作环境中,则可以对要做出的决定和受控系统的预期结果施加一定的限制,”他说。
灰箱建模
Tuor和他的PNNL同事JánDrgoňa和Draguna Vrabie最近将其混合方法应用于常微分方程。微分方程本质上是复杂的数学公式,工程师经常使用它们来为实际系统的运行建立基于物理学的模型和控件。
尽管基于物理学的模型适用于关键任务系统,但它们不容易从一个系统转移到另一个系统,并且需要建模系统的基础物理学方面的专门知识。
在混合方法中,PNNL研究人员将微分方程建模为深度神经网络。已知物理学在深度神经网络中表示为不同的层,该层将数据需求集中在其余层上训练模型。
嵌入已知物理学也可以打开该模型进行分析,因为该模型不再是黑匣子-混合方法可洞悉该模型为何做出某些决策。
“您可以将其视为灰盒建模,而不是黑盒建模,” Tuor说。
混合方法具有捕获现实世界系统中复杂的反馈交互的能力。研究人员说,这可以对系统行为进行准确的预测,并可以进行系统优化以实现安全性能。
概念证明
为了证明这一概念,Tuor和他的同事使用该技术对建筑物的热力系统进行建模和控制。表现最佳的解决方案是在神经网络的结构中嵌入了领域知识的解决方案。
Tuor和他的同事们最近 在2020年国际学习表示会议上的一篇论文中介绍了结果,该会议是深度学习专家的虚拟聚会。从那时起,该团队开始研究更复杂的系统,并将很快将该方法应用于PNNL的一种称为搅拌摩擦焊的制造过程,该过程是不熔化金属的焊接过程。
“我们将能够采用我们正在开发的方法,并将其部署在真实的物理过程中,从而真正验证这是一项有用的技术,” Tuor说。
他补充说,该团队计划从那时开始将该技术应用于从无人驾驶汽车和卡车到太阳能无人飞行器的扩展自主任务以及无人水下航行器的自主任务的所有领域。