工程师说 | 面向AD/ADAS的SoC的AI性能优化

Yuji Obayashi Principal Software Engineer

本文介绍了瑞萨在早期设计阶段针对自动驾驶（AD）和高级驾驶辅助系统（ADAS）的SoC中用于AI处理的深度神经网络（DNN）加速器的性能、电路尺寸和功耗的工作内容。

背景

近年，随着深度学习（DeepLearning）人工智能（AI）技术的进步，我们的生活中出现了许多直接有益的应用场景，例如自动翻译精度的提升和根据消费者喜好的个性化推荐。截至2023年，AI在某些领域已经成为产品和服务中不可或缺的应用，其中之一就是自动驾驶（AD）和先进驾驶辅助系统（ADAS）。

(资料图片仅供参考)

以深度神经网络（DNN）为代表的最新人工智能模型的处理需要大规模的并行计算，因此在PC开发中通常使用通用的GPU进行并行计算。另一方面，用于AD和ADAS的SoC多数搭载了专用电路（以下简称加速器），实现了低功耗和高性能的DNN处理。然而，在SoC开发的早期阶段，确认搭载的加速器能否在实际所需的DNN中提供足够的性能通常并不容易。性能比较的指标常常使用加速器设计上的最大计算性能TOPS（Tera Operations Per Second）值，或者其与运行时消耗的功率相除得到的TOPS/W值。然而，由于加速器是针对特定处理的专用设计（*1），即使TOPS值足够高，在实际所需的DNN中也可能由于存在无法高效处理的计算或数据传输带宽不足等问题而无法提供足够的性能。此外，加速器的功率增加可能导致整个SoC的功耗超过可接受的范围。

（*1）专用设计：虽然使用通用GPU作为加速器也是可能的，但处理特定任务的硬件，可以在较小的电路规模和功耗下获得更高的处理性能。例如瑞萨的车载SoC R-Car V3H、R-Car V3M和R-Car V4H搭载的加速器具有专为处理DNN中使用卷积操作进行特征提取的卷积神经网络（CNN）任务而设计的结构。

随着SoC开发的深入，由于性能不足或功耗过大等原因而进行设计变更的难度普遍增加，对SoC开发进度和开发成本的影响也随之增加。因此，在开发面向车载AI设备的SoC时，确认搭载的加速器能否在实际顾客产品中所需的DNN中提供足够的性能，并且功耗是否在可接受范围内，已成为迫切的问题。

面向AD/ADAS的一般AI开发流程

在解释如何解决上述问题之前，先简单介绍一下AD/ADAS的AI开发流程。下面的图1展示了在AD/ADAS中以软件为核心，并包括部分SoC开发的AI开发流程的示例。

图1：AD/ADAS中AI开发流程的例子

图1将整个开发工作分为六个阶段，其中第2和第3阶段为SoC电路设计，其他第1和第4-6阶段为软件开发。下面给出了每个阶段的工作概述。

第一阶段 AI Application/Service Common Development

利用PC和云环境，以应对市场需求和技术趋势，开发面向AD/ADAS的AI应用程序和服务。

第二阶段 AI Accelerator Detail Design

涵盖了构成加速器硬件的部件设计，如计算单元、内部存储器和数据传输单元。

第三阶段 AI Accelerator Configuration

在第三阶段中，第二阶段中设计的组件被组合起来，以优化面积、功率和性能之间的权衡，同时确定加速器在SoC中的配置以实现各自的设计目标。

第四阶段 DNN Model Architecture Design

在第三阶段中确定的加速器配置被用来优化每个用于客户产品的DNN网络的结构。

第五阶段 DNN Inference Optimization

将针对经过第四阶段结构优化的每个网络进行适用于加速器的代码生成，并进行精度和处理时间的详细评估。同时，将对代码和模型数据进行优化，以提高性能。

第六阶段 Application Development

将使用第五阶段中优化的代码和模型数据，将AI处理部分嵌入到实际的自动驾驶等处理中，并进行应用的实现和评估。

瑞萨的工作

在上一节所示的AD/ADAS中的AI开发流程中，判断实际使用的DNN是否能够在所配备的加速器上提供足够的性能，通常需要在决定加速器配置的第三阶段AI Accelerator Configuration中进行决策。

传统上，在这一阶段的决策是通过使用类似加速器的现有SoC进行的基准测试结果来估计的，但对于因增加或改变功能而与现有SoC规格不同的部分，无法获得基准测试结果，因此无法通过高度精确的估计来确定是否能达到设计目标。

瑞萨通过使用PPA Estimator（PPA：Performance，Power，Area）而不是现有的SoC基准测试来解决这个课题。PPA Estimator通过使用反映加速器每个组件设计的性能和功率计算模型，使性能和功耗在加速器配置最终确定之前得到估算。具体来说，列出可能的加速器配置（可改变的加速器参数的组合，如处理单元的数量和内部存储器的容量）进行评估，选择其中一个配置并与要评估的一个DNN一起输入PPA Estimator中，以获得所需的执行时间和功耗。然后，可以针对所需评估的加速器配置和DNN的数量进行重复操作，收集数据，并找到最佳的加速器配置。如此，不仅可以确定一个特定的加速器配置和DNN组合是否有足够的性能，而且还可以收集广泛的数据并从中选择最佳加速器配置。

此外，为了使第三阶段AI Accelerator Configuration更加有效，瑞萨还通过将从PPA Estimator执行结果中获得的信息反馈给目标DNN的网络模型，并行改进软件方面的工作，也就是进行硬件-软件联合设计（co-design）。AI Accelerator Configuration阶段的工作流程如下图2所示。

图2：AI Accelerator Configuration工作流程

瑞萨已开始将PPA Estimator应用于从2023年开始的一些带有AI处理加速器的AD/ADAS的SoC的开发中，并计划逐步扩大应用范围。瑞萨将利用PPA Estimator的高度精确性能寻找最佳配置以开发高性能、低功耗的车载AI加速器。

关键词：

联想发布DWS数字办公空间解决方案瞄准混合办公市场	如何下载电子书到mp4 如何下载电子书到mp4
港股异动 \| 业聚医疗(06929)现涨超6% 预计上半年归母净利同比增超2倍	小松：2023年4-6月净利润1054亿日元，同比增长31%
二六三（002467）：8月1日技术指标出现看涨信号-“红三兵”	恒烁股份（688416）：该股换手率大于8%（08-01）
工程师说 \| 面向AD/ADAS的SoC的AI性能优化	精进电动：公司是小鹏汽车的供应商，公司的产品主要配套G3和P7车型
我国首条设计时速350公里高铁15岁，这张“金名片”越擦越亮！	bin文件用什么打开手机 bin文件用什么打开
浙江大学农业与生物技术学院教授喻景权——让科学技术真正走进农田（讲述·弘扬科学家精神）	张雨霏也“追星”：最想吃火锅，泳衣是“花花”
工行辽宁省分行上半年公司贷款总量突破2840亿元	西藏一游客在国道看风景，景区的人过来制止：不能看也不能拍照
西行纪燃魂最强角色	长江商学院：7月中国企业经营状况指数回升至50.9
河南继续发布暴雨蓝色预警：这些地方仍有暴雨，局部大暴雨	（Z世代“走”大运）中国箭手周嘉玉：希望带动更多人加入射箭运动
《青年说》第四十八期 90后博士在田间地头“自找苦吃”	长汀县养老院哪家好？长汀县养老院一览表
澳大利亚利率决议前瞻：不出意外的话继续加息25基点	西部数据：大型云服务商处于一个“非常严重的库存消化阶段” 暂停购买任何东西
游客国道看风景被收费，文旅局致歉：严肃处理景区经营企业和相关责任人	台媒嘲讽中国大运男篮：被痛宰 10年耻辱再现我们等于亚洲冠军
上海雅仕：7月31日融资买入294.53万元，融资融券余额1.29亿元	最新！两国表态：“军事干涉就是宣战”
国际金融体系失衡加重南方国家负债	美国最大产油州五月日均原油产量创历史新高
马斯克：美国电力短缺阻碍人工智能发展	中国四大银行哪个靠谱（中国四大银行那个最好依次排名）
华北多地暴雨持续北京河北等地全力抢险救灾	我想买翡翠手镯去哪买比较好呢
今日申购：科净源、宏裕包材	甘井子公安分局发布通告：这些投资人尽快提供证据材料
杭氧集团与东华科技签订战略合作协议	三大指数全线翻红，贵金属、证券等板块走强
小吃车的价格（美食小吃车价格）	中国民航局：上半年航空运输生产有序恢复
天山佳酿香飘“东方之珠”	中信证券：用电增速放缓火电受益水电利用小时疲弱
核电板块盘初走强金通灵涨超11%	上半年保持高双位数增长汾酒速度助推“大清香时代”
北京小清河桥局部坍塌致五车坠河，初步判断无人员落水	山东商业职院积极推动产教融合、科教融汇产业学院实体化带动校企共生长
脱贫地区产业发展应稳扎稳打	台风“卡努”逐渐增强，将带来哪些影响？
在新的赶考路上走在前、作示范	太平洋录得6天5板
国电南瑞：7月31日融资买入1588.2万元，融资融券余额6.42亿元	隐形冠军丨废水能养鱼的特钢“梦工厂”如何炼就？
我市“三心”服务助推工业高质量发展	金界传奇：短期内黄金仍有冲高动能！
泉声咽危石的下一句诗句是什么（心如磐石下一句是什么）	江苏省苏州市2022-2023学年高二下学期期末语文试题
预期，若见拐点	展示多元文化促进民心相通
2023山东泰安新泰市招聘教师体检第五次递补通知	3D打印行业研究报告：传统技术的革新，打印世界的力量
再被传在印度投资工业富联再澄清：不实	已为风电场收购提供支撑，上海自贸区这个中亚分中心在哈萨克斯坦挂牌
首次！汉文帝霸陵殉葬坑发现大熊猫骨骼：2000多年了	新化县优化营商环境调研发现问题交办会召开
科技早报 \| 快手预计上半年业绩扭亏为盈富士康计划在印度投资近5亿美元建厂	故宫600年不积水，现代排水科技反而导致积水？官方回应
年产值翻了50番！这家企业直呼：来九亭发展，就是来对了地方	中瓷电子：公司产品未用于GPU、CPU算力芯片的封装
伍家岗区推出事前导办、帮办代办、一件事一次办、就近办等 “六办”服务为个体户解难	涉通州区四个街道，这些老旧小区将启动综合整治工程！
信达证券：人形机器人有望提高机器人相关电机市场空间	被砸近跌停 2800亿“医药一哥”恒瑞医药火速出手 “剧透”激励计划三季度实施
159家公司获机构调研	队记：巴特勒可能会寻求一份超过杰伦-布朗合同的续约
洛阳警方对四类盗窃案件实行“有案必破”	女足世界杯丨英格兰队主帅：伤病不影响实力目标击败中国队
福建龙岩永定河落水救人视频直击北京暴雨：永定河水变泥浆基本情况讲解	深圳拟发放千万补贴旅行社
江淮和悦rs油耗江淮和悦rs油耗1.5对比rs1.8的油耗	素食可有效降低胆固醇、血糖和体重
创业板透明工厂股哪家强?市值排名来了!	二季度全国跨省异地就医直接结算超2800万人次
物流赛道活跃度提升业务高速增长	下半年交通稳增长圈定五大重点
云顶之弈s7.5灵魂虹吸纳尔怎么玩云顶之弈灵魂虹吸	【军事巨变】揭秘：俄军最大威胁非乌克兰，中国空军长春应对策略
宁夏用水权改革让“每一滴水都在增值”	电流激发工程化细胞产生胰岛素
从严从紧控制现代煤化工产能规模	北京发布分区域暴雨红色预警！7区降为“橙色”
欣旺达07月31日获深股通增持151.41万股	家电业深挖潜力创新供给促消费政策利好频出
圣农集团拓展业务新领域 “孵”出全产业链	促进新消费发展加快消费提质升级
体育、健康、文化……成都FISU世界学术大会这些热词受关注	多只FOF优化业绩基准设置，重点从宽基指数向基金指数过渡
以优化服务繁荣夜经济（纵横）	发挥期市支农作用浓墨重彩描绘乡村振兴新画卷
中国大运男篮三战皆败排位赛将对阵蒙古	全国首个跨省域高新区花落长三角示范区
2022年01月31日整理发布：七夕布谷鸟是什么意思	空间背景音乐设置（空间背景音乐链接怎么弄啊有没有简单的方法啊）

工程师说 | 面向AD/ADAS的SoC的AI性能优化

背景

面向AD/ADAS的一般AI开发流程

瑞萨的工作

相关阅读

精彩推送

每日推荐

5元钱的拌面在复工潮中创造商机

要闻

资讯新闻