作为一家专注于创新算法的公司,Vsora在无线通讯领域上,积累了数十年的数字信号处理以及最新5G蜂窝网络标准的设计经验。
Vsora的创新架构在于DSP设计的程序化,其灵活的可扩展性,实现了纯软件的多核设计。在同一架构下,实现DSP与AI人工智能加速器的双重功能。特别适合自动驾驶产业的芯片设计与开发。
AD1028是一个IP核,内嵌一个PetaFLOPS计算平台,借助于该IP核的高效运算能力设计的低功耗芯片L4 / L5控制单元,极大地帮助自动驾驶行业缩短芯片设计周期。
在LV4级的自动驾驶中,仍然由驾驶员操控车辆。在LV5级中,必须实现脱离人类的全自动驾驶功能,因此实现LV5级的自动驾驶的高速精准运算能力是相当艰巨的挑战。
首先,机车要学习在行驶过程中,由环境变化带来的自定行驶行为。这个过程我们称之为“感知“,这个过程需要最先进的DSP技术来处理感应器收集的大量信息。这个流程由雷达、光达、镜头、超音波感应器组合而成,并配合全球卫星导航系统提供的数据,及沿途5G信号和蜂窝V2X(C-V2X)数据。
例如,我们计划从A点自动驾驶到B点,那么就需要详细收集到两点之间的如下数据:
1,两点之间可能存在哪些固定和移动障碍。
2,应遵守的交通规则。
3,天气对行驶的影响。
4,路况对路径的影响。
5,其它可能影响到实际行驶路径的因素。
除了已收集的信息,在实际行驶中,自动驾驶系统需频繁且快速进行数据更新,以应对不可预测的突发事件。在处理收集到信息之前,必须对传感器数据进行快速过滤,以消除噪声和其它随机产生的复杂干扰信号,这就需要通过先进的DSP算法与AI结合运算,过滤掉不真实的信息及干扰,从而在综合多个传感器信息时,得到干净正确的数据。
两种最常见的传感器融合类型是使用状态估算器(如卡尔曼滤波器)和基于机器学习的融合。 卡尔曼滤波基于假设一个线性高斯系统,在实际行驶中,可能导致错误的结果。
一种优选的方法是通过粒子滤波器Particle Filter (也称为顺序蒙特卡罗SMC方法)建模非线性系统和非高斯状态分布。 而PF也可以用于物体跟踪,运动规划和路面评估。
在规划阶段,在运行感知过程中收集并预处里的干净数据,此时人工智能及深层神经网络(DNN)开始介入数据处理并输出相应指令。
VSORA设计了一种使DSP和DNN加速通过共享的高带宽片上存储器交换数据的计算配置,允许在感知阶段即并行启动信号处理和AI算法,规划阶段即可采集到有效数据并同步处理,藉此把系统延迟降到最低。
该配置消除了因受数据传输带宽限制引起的与外部存储器交互的性能瓶颈,通过大幅缩短数据到内存的时间来减少延迟并降低功耗。
AD1028可以同时处理两种类型任意组合传感器的融合,包括融合信号处理时的混合融合以及AI功能。 例如镜头与激光雷达或雷达之间的融合。
AD1028的计算能力达到1028TeraFLOPS(千兆浮点运算), 运行频率为2GHz。在Yolo-v3上处理800万像素的图像仅需7ms, 处理高解析图像不超过1.6ms. AD1028支持所有类型传感器运算,可并行组合也可串行组合。研发人员可以无需更改算法,自行配置信号处理和AI运算的处理架构
2019年,三菱电气研究实验室发布了一篇论文,详细介绍一个PF实现,该试验使用500个粒子,共耗时5ms执行完任务。 相比之下,VSORA AD1028处理的PF包含1600万个粒子,在不到8ms的时间完成。
在AD1028平台上开发,业者可使用通用的Matlab、Tensorflow和C++高级语言完成。这让用户能够迅速进入LV4和LV5的研发,无需复杂的低级汇编语言或靠硬件连接加速器去开发。
同时,现有解决方案也可以轻松升级到未来更高级的功能需求。
AD1028采用7纳米工艺技术,逻辑面积为35mm2,消耗小于35瓦。
AD1028是VSORA系列产品中第一款具有多种处理能力的产品。 系列产品中AD514具有514TFLOPS运算能力,AD2056具有2056TFLOPS运算能力。 这两个产品都将在年底前发布。