新技术使智能边缘设备上的AI模型训练成为可能

通过尚塔尔Polsonetti

类别:
收购或合伙

微控制器是数十亿连接设备的基础,从物联网(IoT)设备到汽车传感器。但是廉价、低功耗的微控制器内存极其有限,而且没有操作系统,这使得在独立于中央计算资源的边缘设备上训练人工智能模型具有挑战性。

在智能边缘设备上训练机器学习模型可以使其适应新的数据并做出智能边缘设备更好的预测。例如,在智能键盘上训练一个模型可以使键盘不断地从用户的书写中学习。然而,训练过程需要如此多的内存,以至于在将模型部署到设备上之前,通常使用强大的数据中心计算机或云计算来完成。这样做成本更高,还会引发隐私问题,因为用户数据必须发送到中央服务器。

为了解决这个问题,麻省理工学院和麻省理工学院- ibm沃森人工智能实验室的研究人员开发了一种新技术,可以使用不到四分之一兆字节的内存进行设备上的训练。其他为连接设备设计的训练解决方案可以使用超过500兆字节的内存,大大超过大多数微控制器256千字节的容量。

研究人员开发的智能算法和框架减少了训练模型所需的计算量,这使得过程更快,内存效率更高。他们的技术可以在几分钟内用于训练微控制器上的机器学习模型。

这项技术还通过将数据保存在设备上来保护隐私,这对敏感数据尤其有利。它还可以根据用户的需求进行模型定制。此外,与其他训练方法相比,该框架保留或提高了模型的准确性。

这项研究声称,物联网设备不仅可以执行推理,还可以不断更新人工智能模型到新收集的数据,为终身设备上学习铺平道路。低资源利用率使得深度学习更容易获得,可以有更广泛的覆盖范围,特别是对于低功耗的边缘设备。

轻量级的训练

神经网络是一种常见的机器学习模型。这些模型大体上以人脑为基础,包含层层相互连接的节点(或神经元),它们处理数据以完成一项任务,比如识别照片中的人。首先必须训练模型,这包括向它展示数百万个例子,这样它才能学习任务。在学习过程中,模型会增加或减少神经元之间的连接强度,这被称为权重。

模型在学习过程中可能经历数百次更新,中间激活必须在每一轮中存储。在神经网络中,激活是中间层的中间结果。因为可能有数百万个权重和激活,训练一个模型比运行一个预训练的模型需要更多的内存。

研究人员开发了一种名为微型训练引擎的系统,可以在一个没有操作系统的简单微控制器上运行算法创新。该系统改变了训练过程中步骤的顺序,因此在模型部署到边缘设备之前,在编译阶段完成了更多的工作。

成功的加速

研究优化只需要157千字节的内存就可以在微控制器上训练机器学习模型,而其他设计用于轻量级训练的技术仍然需要300到600兆字节。他们通过训练计算机视觉模型来检测图像中的人来测试他们的框架。仅经过10分钟的训练,它就学会了成功完成任务。他们的方法训练模型的速度比其他方法快20倍以上。

这项工作由美国国家科学基金会、麻省理工学院- ibm沃森人工智能实验室、麻省理工学院人工智能硬件计划、亚马逊、英特尔、高通、福特汽车公司和谷歌资助。

与ARC咨询集团合作

Baidu
map