FPGA工程师进阶必学时序分析的基本步骤和整体设计思路.docx
-
资源ID:1204112
资源大小:211.20KB
全文页数:10页
- 资源格式: DOCX
下载积分:5金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
FPGA工程师进阶必学时序分析的基本步骤和整体设计思路.docx
时序分析的基本步骤一个合理的时序约束,可以分为以下步骤:时序约束整体的思路与之前我说的方法基本一致。整体的思路如下:1 .先是约束时钟,让软件先解决内部时序问题;(在这一步骤中可以适当加入时序例外,以便时序通过)2 .然后再加入IO的延迟约束;3 .最后针对没有过的时序,添加时序例外。在vivado使用误区与进阶中,提到了一种叫UItraFAST的设计方法。针对下图中所说的根据迭代结果添加必要的例外约束(步骤1),为什么是添加必要的呢?是因为虽然是跨时钟域,但是有时候就算不约束,时序也能过。当碰到时序不过的时候,现阶段可以去针对该部分路径进行时序例外约束,以便后续继续分析。需要注意的是,就算没有报时序为例,现阶段也一定要去留意那些跨时钟的路径(通过CIOCk_interaction),确认代码有没有做相应的跨时钟域处理。针对跨时钟域的代码处理后面会提到。如何使用时序约束向导TCW进行baselining约束Disable用户的XDC文件创建新的baselineXDC文件,并设置成target运行时序约束向导TCW- 约束所有时钟及时钟相互关系- 运行CDC跨时钟域报告检直CDC问题第一遍先跳过IO约束迭代各个阶段,验证各个阶段的时序问题- 根据迭代结果添加必要的例外约束- 确保内部时序满足要求在随后的流程中再添加IO和其他例外约束- 迭代各个阶段,验证各个阶段的时序问题阶段1BaSelining时序约束开发技巧创建一个最小但充分的时钟约束- 大部分时序问题是内部寄存器间的问题(register-to-register)- 该阶段不要考虑Ic)时序问题- 在baselining阶段是不需要添加IO时序约束- 针对跨时钟域CDC路径使用适当的例外时序约束(SeuaISe_path,set_max_delay-datapath_only,set_clock_groups)定义时钟约束时钟主要可以分为主时钟以及衍生时钟。创建主时钟。典型的主时钟根包括有以下几种情况:输入端口、千兆位收发器输出引脚以及某些硬件原语输出管脚。X13446用于输入端口的CreatJdoCk约束实例:create_clock-nameSysClk-period10-waveform05get_portssysclkGT收发器输入引脚,例如已恢复的时钟。原语引脚上的create_dock约束实例:create_clock-nametxclk-period6.667get_pingtO/TXOUTCLK创建星成时钟自动衍生时钟大部分生成时钟都由ViVadO设计套件时序引擎自动衍生获得,该引擎可识别时钟修改模块(CMB)及其对主时钟所执行的变换。赛灵思7系列器件中,CMB是:MMCM*PLL*BUFRPHASER*如果Vivado设计套件时序引擎所选择的自动衍生时钟名称并不合适,您可以使用Create.generateCLCIoCk命令强行定义自己的名称,此时无需指定波形转换。该约束应刚好位于约束文件中定义主时钟的约束之后。例如,由MMCM实例生成的时钟的默认名称是net,您可以添加如下约束强制将其设定为自己的名称(例如fftClk):create_generated_clock-namefftClkget_pinsmmcm_i/CLKOUTO生成前钟源自另一个现有时钟(主时)。通常后来描述由逻辑模块在主时钟上执行的波形变换。由于生成时钟的定义取决于主时钟特性,因此必须首先定义主时钟。要明确定义生成时钟,必须使用Create_generated_clock命令。clJBUFJnstc1BUJBUFJczQn-Ck,f¾<10>-C>2Y主时钟扇出中的生成时钟IBUFWJFC4create_generated_clock-nameGCl-SourceIget_pinsgen_clk_reg/C-divide_by2get_pinsgen_clk_reg/Q1跨时终域显理跨时钟域处理,主要是为了避免亚稳态的传播(注意亚稳态不能消除,但是可以采用一定的方式,降低其传播的风险)。触发器进入亚稳态的时间可以用参数MTBF(MeanTimeBetweenFailures)来描述,MTBF即触发器采样失败的时间间隔,表示为:MTBF=exp(C2XImT)Cl×clodc×<a例如针对单bit数据的跨时钟域处理,是为了让MTBF增大,使得进入一个可接受范围。跟大家探讨一个问题,为什么打两拍就可以降低亚稳态的传播呢?我想到的一个场景如下:信号a经过跨时钟处理后变成了a这样就可以确保在时序满足的前提下,同一个时钟域中的1、2、3模块接收到的点的值是一致的,如果不做跨时钟域处理,由于布局布线的延迟不一样,不能确保到达1、2、3模块的值是一致的,从而导致逻辑混乱,引起系统的不稳定现象。IO的延迟约束输入延迟外部器件发送数据到FPGA系统模型如下图所示。对FPGA的IO进行输入最大最小延时约束是为了让FPGA设计工具能够尽可能的优化从输入端口到第一级寄存器之间的路径延迟,使其能够保证系统时钟可靠的采到从外部芯片到FPGA的信号。外部器件FPGA输入延时即为从外部器件发出数据到FPGA输入端口的延时时间。其中包括时钟源到FPGA延时和到外部器件延时之差、经过外部器件的数据发送Tco,再加上PCB板上的走线延时。如下图所示,为外部器件和FPGA接口时序。最大输入延时(inputdelaymax)为当从数据发送时钟沿(IanUChedge)经过最大外部器件时钟偏斜(Tclkl),最大的器件数据输出延时(TCo),再加上最大的PCB走线延时(TPCb),减去最小的FPGA时钟偏移(FTSU)的情况下还能保证时序满足的延时。这样才能保证FPGA的建立时间,准确采集到本次数据值,即为SetUPSlaCk必须为正,计算公式如下式所示:Setupslack=(Tclk+Tclk2(min)-(Tclk1(max)+Tco(max)+Tpcb(max)+FTsu)>0(1)最小输入延时(inputdelaymin)为当从数据发送时钟沿(IanUChedge)经过最小外部器件时钟偏斜(TClk1),最小器件数据输出延时(TCo),再加上最小PCB走线延时(TPCb),此时的时间总延时值一定要大于FPGA的最大时钟延时和建立时间之和,这样才能不破坏FPGA上一次数据的保持时间,即为holdslack必须为正,计算公式如下式所示:Holdslack=(Tclk1(min)+Tco(min)+Tpcb(min)-(FTh+Tclk2(max)>0(2)我们很容易就可以从公式(1)和(2)推到出(3)Tclk-Ftsu>Tclkl-Tclk2+Tco+TpcbFTh(3)在公式(3)中,我们发现TClk、Ftsu以及FTh,对于工具来说是已知的,而Tclkl-Tclk2+Tco+Tpcb正是我们需要告知综合工具的延迟量。从我们推到出的公式,我们可以得到:Input_delay_max=Tclk-Ftsu;Input_delay_min=FTh;输出延迟FPGA输出数据给外部器件模型如下图所示。对FPGA的IO口进行输出最大最小延时约束是为了让FPGA设计工具能够尽可能的优化从第一级寄存器到输出端口之间的路径延迟,使其能够保证让外部器件能准确的采集到FPGA的输出数据。FPGA外部器件输出延时即为从FPGA输出数据后到达外部器件的延时时间。其中包括时钟源到FPGA延时和到外部器件延时之差、PCB板上的走线延时以及外部器件的数据建立和保持时间。如所示,为FPGA和外部器件接口时序图。OSCFPGA.CLKFPGAQASSPDASSP.CLK最大输出延时(OUtPUtdelaymaX)为当从FPGA数据发出后经过最大的PCB延时、最小的FPGA和器件时钟偏斜,再加上外部器件的建立时间。约束最大输出延时,是为了约束IO口输出,从而使外部器件的数据建立时间,即为setupslack必须为正,计算公式如下式所示:Setupslack=(Tclk+Tclk2(min)-(Tclk1(max)+FTco(max)+Tpcb(max)+Tsu)>0(4)最小输出延时(outputdelaymin)为当从FPGA数据发出后经过最小的PCB延时、最大的FPGA和器件时钟偏斜,再减去外部器件的建立时间。约束最小输出延时,是为了约束IO口输出,从而使IO口输出有个最小延时值,防止输出过快,破坏了外部器件上一个时钟的数据保持时间,导致Modslack为负值,不能正确的锁存到数据,最小输出延时的推导计算公式如下式所示:Holdslack=(Tclk1(min)+FTco(min)+Tpcb(min)-(Th+Tclk2(max)>0(5)我们很容易就可以从公式(4)和(5),发现这两条公式与前面推导输入延迟如出一辙。只不过现在FPGA变成了输出器件,而Tsu、Th是下游器件的参数,综合工具并不知情,需要我们告诉他。除了FTco以外,其他参数都需要我们告诉工具。由公式(4)我们可以推导出:Fco(max)+Tpcb(max)-(Tclk2(min)-Tclk1(max)+Tsu<Tclk那么outputdelaymax=Tpcb(max)-(Tclk2(min)-Tclk1(max)+Tsu同理我们由公式(5)可以推导出:FTco(min)+Tpcb(min)-(Tclk2(max)-Tclk1(min)-Th>0那么outputdelaymin=Tpcb(min)-(Tclk2(max)-Tclk1(min)-Th附参考资料:静态时序分析的基本概念和方法在同步电路设计中,时序是一个非常重要的因素,它决定了电路能否以预期的时钟速率运行。为了验证电路的时序性能,我们需要进行静态时序分析,即在最坏情况下检查所有可能的时序违规路径,而不需要测试向量和动态仿真。本文将介绍静态时序分析的基本概念和方法,包括时序约束,时序路径,时序裕量,SetUP检查和hold检查等。时序路径同步电路设计中,时序是一个主要的考虑因素,它影响了电路的性能和功能。为了验证电路是否能在最坏情况下满足时序要求,我们需要进行静态时序分析,即不依赖于测试向量和动态仿真,而只根据每个逻辑门的最大延迟来检查所有可能的时序违规路径。时序,面积和功耗是综合和物理实现的主要驱动因素。芯片EDA工具的目标是在最短的运行时间内,用最小的面积和功耗,生成满足时序网表,并进行布局和布线。EDA工具会根据设计者给定的约束条件,在时序,面积,功耗和EDA工具运行时间之间做出权衡。芯片要想以期望的时钟频率运行,就必须遵守时序约束,因此时序是最重要的设计约束。静态时序分析的核心问题是“在所有情况下(multi-modemulti-corner),每个同步设备(Synchronousdevice,例如触发器)的数据输入端,在时钟边沿到达时,是否已经有正确的数据?”TimingPathExample上图中的虚线箭头代表了时序路径。为了保证数据能被准确地锁存,数据信号必须在时钟边沿到达触发器FF2的时钟端之前,传递到触发器FF2的数据端。setup检查CLK.八1.aunchedgeCaptureedge上图展示了这条时序路径的时序情况。当时钟边沿到达FFl时,FFl会锁存FFLD的数据。经过触发器的CLK-to-Q延迟后,数据会出现在触发器的输出端FFl.Qo这个过程叫做时序路径的Iaunchevento然后,数据信号经过一定的延迟,通过组合逻辑,到达触发器FF2的输入端FF2.Do数据信号到达这里的时间叫做路径的arrivaltimeo为了让FF2能正确地锁存数据,FF2.D的值必须在时钟边沿到达FF2的时钟端之前稳定下来,并且提前一定的时间,即触发器的建立时间。这个最小的允许时间叫做路径的requiredtime。FF2锁存数据的过程叫做时序路径的Captureevent0时序裕量时序路径是否满足时序约束,取决于它的时间裕量,即SIaC匕如果数据信号比必要的时间早到达,那么SIaCk就是正值。如果数据信号刚好在requiredtime到达,那么slack就是零。如果数据信号比requiredtime晚到达,那么slack就是负值。在任何情况下,slack都等于requiredtime减去arrivaltimeo上面描述的时序检查叫做setup检查,它用来验证数据是否能在每个时钟边沿之前及时到达时序电路。这是综合和时序优化中最常见的一种时序检查类型。hold检查hold检查用来验证数据在时钟边沿到达后,还能保持多久的有效性。如果从launch到capture的数据路径上的组合延迟太短,而从launch到capture的时钟路径上的延迟太长,就有可能出现hold违规。下图给出了这种情况的例子。FF2上图中,数据从FFl到FF2的时序路径只经过了一个NAND门,组合延迟非常短。而时钟信号从时钟源到FF2的路径上有三个缓冲器,延迟非常长。t1.aunchedgeCaptureedge上图显示了这种情况下的可能时序。由于数据在SeuIPtime之前到达,所以很容易满足SetUP约束。然而,问题在于FF2的D输入端的数据不能保持足够长的时间,导致hold约束不能满足。也就是说,数据在时钟CLKB锁存之前发生变化。为了修复这种类型的违规,我们可以通过缩短时钟线的延迟或增加数据路径的延迟来调整时序。最坏情况(worst-caseconditions)Multiple Paths Through Combinational Logic每种类型的时序检查都考虑了不同的最坏情况(WOrSt-CaSeCOnditiOnS)。例如,一个SetUP检查(验证数据是否在时钟边沿之前到达)考虑最长的组合逻辑/最慢的数据路径,以及最早的时钟路径。相反,hold检查(验证数据是否在时钟边沿之后保持有效的时间)考虑最短/最快的数据路径,以及最晚的时钟路径。上图显示了通过同一个模块不同组合逻辑路径的示例。在数据路径中,setup检查会考虑较长的延迟(通过三个门),而hold检查将考虑较短的路径(通过两个门)。