全文共1921字,预计学习时长5分钟
图源:unsplash
本文将回顾基于TCN解决方案的最新创新。首先,列出运动检测个案分析并简要回顾TCN架构及其相对于传统方法的优势,如卷积神经网络(CNN)和递归神经网络(RNN),随后,笔者将介绍使用TCN的几个创新之处,包括改善交通预测,声音事件定位和检测以及概率预测。
对TCN的简要回顾
Lea等人(2016)的开创性著作首次提出一种基于视频动作分割的时序卷积网络(TCNs)。这一常规过程包括两步:首先是低级特征的计算,这些计算(通常)使用对时空信息进行编码的CNN,其次将这些低级特征输入到一个(通常)使用RNN采集高级时间信息的分类器中。
这种方法的主要缺点是需要两个独立模型,而TCN提供了一个统一的方法,可以分层次地获取所有两个等级的信息。
编码-解码架构如下图所示,文末前两个参考文献展示了有关该架构的更多信息。最关键的问题如下:TCN可取一系列任意长度并以相同的长度输出。因果卷积在使用一维全卷积网络架构时使用。一个关键的特征是t时刻的输出只与t之前的元素进行卷积。
Lea等人 (2016)
随着最近Yan等人(2020)有关TCN用于天气预报的研究成果发表,《自然》杂志上逐渐出现了有关TCN的讨论。在研究中,他们把TCN和LSTM进行对比实验。在其他方法中,其中一个结论是TCN在处理时间序列数据的预测任务中表现良好。
Yan等人(2020)
接着笔者将介绍经典TCN的运用和延伸。
改善交通预测
共享乘车和在线导航服务可以改善交通预测及改变生活方式。减少交通堵塞,降低污染,安全快速的驾驶……更优的交通预测能做的远不止于此。
这是一种实时数据驱动问题,因而有必要利用未来交通流量的数据累积。基于此,Dai等人(2020)近期提出了一种混合时空图卷积网络(H-STGCN),总体思路为利用分段-线型-流量-密度关系,将未来交通量转换为其等效的行程时间。
在文章中,学者们使用的最有趣的方法之一是利用图卷积捕捉空间依赖性。复合邻接矩阵捕捉了交通近似的本质特征(参见[Li, 2017]获取更多信息)。下列架构采用四个模块描述整个预测过程:
Dai 等人 (2020)
声音事件定位和检测
声音事件定位和检测(SELD)领域不断扩大,理解环境在自主导航中扮演着重要角色。
最近,Guirguis等人(2020)提出了一种声音事件SELD-TCN的新型架构,并声称这种架构训练时间更快,优于该领域的最高水准。在他们的SELDnet中(如下架构),一个采样为44.1kHz的多通道音频录制运用短时傅里叶变换提取频谱的相位和幅度并将其作为单独的输入特性堆叠。接着,连接卷积块和循环块(双向GRUs),然后连接全连接块。SELDnet的输出是声音事件检测(SED)和波达方向(DOA)。
Guirguis 等人(2020)
为了超越它,他们提出了SELD-TCN:
Guirguis 等人 (2020)
由于空洞卷积使网络能够处理各种输入,因而需要一个更深入的网络(它在反向传播过程中会受到不稳定梯度的影响)。他们采用WaveNet(Dario等人, 2017)架构克服这一挑战,展示SELD任务不需要循环层,并成功检测到活跃声音事件的开始和结束时间。
概率预测
Chen等人(2020)设计的新型架构能应用于估计概率密度。时间序列预测能改善许多经营决策场景(例如资源管理),概率预测可以从历史数据中提取信息,将未来事件的不确定性降至最低。当预测任务用来预测数百万个相关数据序列(就像在零售业务中),需要禁止性劳动和计算资源来进行参数估计。
为了解决这些困难,他们提出了一种基于CNN的密度估计和预测架构。这种架构能学习序列中的潜在相关性。他们的成果的新奇之处在于提出的深层TCN,如架构所示:
Chen 等人 (2020)
由此可见,编码-解码模块解决方案可以帮助实际大型应用的设计。
本文总结了关于时序卷积网络的一些最新成果,它能比经典CNN和RNN方法更好地完成时间序列任务。
留言点赞关注
我们一起分享AI学习与发展的干货
如转载,请后台留言,遵守转载规范