Deprecated: Creation of dynamic property db::$querynum is deprecated in /www/wwwroot/www.zhongyihr.com/inc/func.php on line 1413

Deprecated: Creation of dynamic property db::$database is deprecated in /www/wwwroot/www.zhongyihr.com/inc/func.php on line 1414

Deprecated: Creation of dynamic property db::$Stmt is deprecated in /www/wwwroot/www.zhongyihr.com/inc/func.php on line 1453

Deprecated: Creation of dynamic property db::$Sql is deprecated in /www/wwwroot/www.zhongyihr.com/inc/func.php on line 1454
聊聊最近大火的超异构芯片设计、启动及工作原理----以TDA4芯片为例_爱游戏平台下载-爱游戏登录app-爱游戏体育在线官网
中文/EN

首页 > 新闻中心

聊聊最近大火的超异构芯片设计、启动及工作原理----以TDA4芯片为例

来源:爱游戏平台下载    发布时间:2024-03-13 04:46:22

  超异构芯片最近是比较火的一个名词,其集中特性是将各类不同的芯片内核进行融合,这种集成式芯片设计可以充分整合芯片资源,逐步提升数据计算效率。并且由于芯片在设计之初就打通了相互之间互通兼容性,其内部功能划分和交互统一构建的逻辑优化,相比单芯片功能方案而言,可以明显降低彼此功能和交互的各种掣肘;并且很多设计原理图上可以在芯片之间通过共享某些资源,融合型单芯片能更加进一步降低成本。另外,对于无人驾驶系统设计而言,(80%-90%)的轻量级场景+10%左右的挑战场景+10%左右的极端场景需要出示高性能以行业领先的功率/性能比计算传统和深度学习算法,这些可完全通过超异构的不同芯片核进行覆盖,充分降低复杂度和系统规模。

  超异构芯片是具有高水平的系统集成,以实现先进汽车的可扩展性和更低成本的支持集中式 ECU。关键核心包括具有标量和矢量内核的下一代 DSP,专用深度学习的NN计算核和传统算法加速器,用于通用计算的最新 ARM 和 GPU 处理器,集成的下一代生成成像子系统 (ISP),视频编解码器,以太网集线器和隔离的 MCU 功能安全岛,所有受保护汽车级安全和安保硬件加速器等。

  运行时安全诊断、电压、温度和时钟监控,窗口化看门狗定时器,用于存储器的 CRC 引擎完整性检查

  启用需要大量数据的系统带宽、PCIe 集线器和千兆以太网交换机以及 CSI-2 端口以支持许多传感器输入的吞吐量。

  对于超异构芯片而言,一般是基于异构、可扩展的架构开发,多核异构的优点是各核充分的发挥其处理效能的优点,再加上专用硬件加速器也可处理特定任务,从而在性能、功耗和成本上达到最佳平衡。

  当前被各厂家普遍的使用很成熟的超异构芯片当属TI的Jacinto™ 7 家族的处理器了,当然这也只是初级超异构芯片。不同厂家对其使用方式不完全一致,有将其完全作为SOC芯片使用的,充分使用了其上的AI算力,有些厂家在不太考虑其安全等级要求的情况下也可能将其当做MCU来使用。

  相当于异构芯片域控的MCU芯片单元所起的作用,用于启动底层硬件驱动、同步时间,启动操作系统及顶层应用软件中控制执行类部分逻辑运算。这里MCU域主要是指MCU Island中用于锁步功能的Arm Cortex-R5F充当;TI这类超异构芯片而言,CPU模块(Cortex R5F)用于对SOC域核周边对应的模块需要单独进行电压和时钟设计,同时,采取了专用内存和接口确保其能够与更大的 SoC 隔离。

  此类模块通常使用高度定制化的NN加速器来实现。在环境感知模块中都会涉及大量的典型神经网络(NN)的运算,过程中深度学习算力主要被消耗掉。包括常见的各类图像、激光点云检测算法,比如物体检测、车道线检测、红绿灯识别等。

  其中,在各家域控Tier1开发过程中一般会考虑在A72上运行HLOS(如Linux或QNX),其余核则运行RTOS,整个运行核均可支持AutoSar。使用A72独立双核集群配置有助于多操作系统应用对软件管理程序的最低需求。

  R5F子系统支持低级时序关键处理任务,用于实时性要求比较高的硬件驱动。使用C71(MMA)进行深度学习神经网络NN和模型运算,所以说MMA主要计算单位主要是以Tops为计算单位。

  DSP处理器(C66)功能包含前端和后端视觉处理两方面。前端视觉主要是NV12转BGR、环视拼图,后端进行浮点运算用以充当AI加速器的CNN后处理。

  如上这种结构是一种典型的AI运算模块(又称为AI-DSA),适用于对AI运算性能要求高,算法相对来说比较稳定的情况。由于AI-DSA模块在整个智能驾驶场景运算上使用更为普遍,性能更敏感,对于云端、边缘计算及无人驾驶几段场景的工程化落地更具有可使用性。

  用于图像处理加速单元,包含大量浮点运算和实现动态 3D 渲染以增强观看效果应用程序。同时GPU域也可以认为是高效率的AI运算平台,对于异形场景CornerCase的适配计算效率是最高的。

  如上如果兼顾执行效率和执行性能上,可以做自适应的AI算力分配,普通场景的AI运算能够使用常规CPU+DSA方式来进行,而特殊边缘场景能够使用GPU加速核方式来进行高效能计算。

  VENC/ VDEC用于视频编解码单元,通常高性能的超异构芯片需要适配H.265/HEVC这类高清视频编码器。对于下一代无人驾驶系统来说能够给大家提供更高清的视频编码能力,实现高清视频压缩传输。

  VPAC(Vision Processing Accelerator)用于对图像进行去畸变、下裁剪(Crop)、重整型(Resides)。其目的是确保输入给神经网络单元做处理的图像已经被初步处理过了,这样做才能够提升图像网络处理速度和性能。

  如下图是以简单的图像传输和处理可以讲清楚在这一类超异构芯片上怎么样做数据链路的传输和处理。

  下图是大多数开发板所有的一个存储单元框架,接下来以此图为基础描述ARM芯片的上电启动流程。

  ROM:芯片内部固化存储代码的存储器,其中固化在芯片iROM中的启动代码为BL0。

  RAM:在ROM启动运行的时候,只有RAM是可用的,因此必须要自动从外扩存储器(nand/sd/usb)中拷贝的uboot.bin二进制文件的头最大16K(一般是4K或8K)代码(BL1)。

  SDROM:芯片外部的运行内存,由运行在RAM上的BL1进行初始化,用于运行BL2与应用程序。

  Nand Flash :芯片外部非易失闪存技术的存储器,没有地址总线,不能直接运行代码,需要将代码加载到RAM上面才能运行。

  相应的存储单元涉及Main域和MCU域的管理,且两域分别单独用于片上共享存储单元,他们分别通过多核共享存储控制器MSMC实现相应的存储管理。TDA4内部还存在LPDDR4 w/ECC模块,即使未使用 DDR 接口,其VDDS_DDR均需要用 LPDDR4 电压范围进行供电。

  对于超异构芯片而言,由于采用了多核异构的架构,因系统需求的差异,其相应的启动流程也有一定的差异性,并且由于集成多核制会导致其启动流程比单核和多核同构的处理器会复杂些。

  Bootloader 是在操作系统运行之前执行的一段小程序。通过这段小程序,我们大家可以初始化硬件设备、建立内存空间的映射表,从而建立适当的系统软硬件环境,为最终调用操作系统内核准备好。两种bootloader 可以再一次进行选择 SPL (Secondary Program Loader)或 SBL(Secondary bootloader)两种驱动加载。

  SPL表示程序加载,分为两级加载程序过程。第一级Bootloader是指从ROM 里面的程序中根据启动方式的选择引导并加载 SPL。第二级Bootloader是指对硬件的初始化过程,引导下一级的 bootloader 核或加载并运行应用程序。

  SBL表示驱动加载。能轻松实现对外围设备做配置,比如 DDR,可以加载并启动其它核。为满足快速启动 MCU 执行相关的应用,MCU可以先启动,然后使用BOOT APP 进而引导其它应用程序。在 SBL 启动流程中,SBL 可以直接加载 Linux内核和 DTB。

  对于如上超异构芯片而言,用的最广的要数ARM Cortex-A72核了,因为其在整数、浮点、内存等性能皆有不同程度的提升,虽然还缺少一些细节,不过IPC性能上相对于之前的产品提升了16-30%左右。如下图表示了芯片A72的具体启动原理。

  整个代码启动运行过程包括首先把BL1加载到RAM中运行,然后由BL1对SDRAM进行初始化。最后,代码重定向完成后在内存中执行的uboot的完整代码BL2。

  从应用层面的系统需求来讲,不同的应用可以部署在不同的核,不同核的启动时序影响着系统需求是否能实现。总体来讲,针对系统的应用需求,可能有如下的额外要求:提前Can信息响应、提前启动画面、提前启动摄像头、 提前分配Linux使用空间、提前显示视频动画等。我们应设计合理的 Soc 启动流程来满足系统的需求。

  超异构芯片Super SOC作为ADAS系统普遍应用的处理器,在面向 ADAS 和无人驾驶车辆 (AV) 应用过程中起着举足轻重的作用。智驾领域中,SOC需要深度学习算法中会比传统芯片提供提供高性能计算能力,同时能有效优化其功耗和系统集成度。最终实现支持集中式ECU 或多种传感器的高级汽车平台实现可扩展性和更低的成本。

  引用地址:聊聊最近大火的超异构芯片设计、启动及工作原理----以TDA4芯片为例

  上一篇:英飞凌携手汽车技术公司REE Automotive一同推动绿色低碳出行

  报名赢【养生壶、鼠标】等|STM32 Summit全球在线大会邀您一起解读STM32方案

  有奖征文:邀一线汽车VCU/MCU开发工程师,分享开发经验、难题、成长之路等

  MPS电机研究院 让电机更听话的秘密! 第一站:电机应用知识大考!第三期考题上线,跟帖赢好礼~

  本报告基于车路云一体化智能网联汽车定义,聚焦智能网联汽车、智能化路侧基础设施、云控平台和基础支撑四大领域,根据产业调研和专家访谈数 ...

  作为电力电子行业里的“CPU”,IGBT(绝缘栅双极型晶体管)是国际上公认的电子革命中最具代表性的产品。将多个IGBT芯片集成封装在一起形成I ...

  PREFACE锂离子电池(以下简称“锂电池”)自1991年首次商业化以来,因具备单位体积内的包含的能量、充电效率和输出电压三高等突出优势,同时常规使用的寿命长且 ...

  3月10日22:18,央视总台大型纪录片《能源浪潮》将迎来收官之作第五集《鼎新未来》。21世纪,什么是能源的终极形式?当我们不断调整观察 ...

  仅2023年,就新增了多家本土智驾芯片企业推出了新产品,芯擎科技等企业也处在产品研制阶段,与地平线、黑芝麻智能、芯驰科技等原有企业一同 ...

  COSEL为要求苛刻的应用提供输出功率为3500W的新型无风扇传导冷却式三相高效电源

  EEWorld Datasheet 伴你同行!快来领取200芯积分福利啦~

  免费申请评测:欧时电子(RS Components)树莓派3来袭,待你玩耍带你飞

  3小时实战+剖析:TI工程师手把手带你全面入门MSP430(限量售$4.3开发套件,助你参与动手实验)

  站点相关:动力系统底盘电子车身电子信息及娱乐系统安全总线与连接车用传感器/MCU检测与维修其他技术行业动态

上一篇:详解国产音频DAC芯片的作业原理及使用
下一篇:超导材料+光模块+量子计算中科院独家供货商社保基金常年重仓!
  • 关注我们

  • 微信公众号

  •  赣ICP备19015067号-1  Copyright © 2019- 爱游戏平台下载  All Rights Reserved