Verilog 仿真激励
Verilog 代码设计完成后,还需要进行重要的步骤,即逻辑功能仿真。仿真激励文件称之为 testbench,放在各设计模块的顶层,以便对模块进行系统性的例化调用进行仿真。
毫不夸张的说,对于稍微复杂的 Verilog 设计,如果不进行仿真,即便是经验丰富的老手,99.9999% 以上的设计都不会正常的工作。不能说仿真比设计更加的重要,但是一般来说,仿真花费的时间会比设计花费的时间要多。有时候,考虑到各种应用场景,testbench 的编写也会比 Verilog 设计更加的复杂。所以,数字电路行业会具体划分设计工程师和验证工程师。
下面,对 testbench 做一个简单的学习。
1. testbench 结构划分
testbench 一般结构如下:其实 testbench 最基本的结构包括信号声明、激励和模块例化。
根据设计的复杂度,需要引入时钟和复位部分。当然更为复杂的设计,激励部分也会更加复杂。根据自己的验证需求,选择是否需要自校验和停止仿真部分。
当然,复位和时钟产生部分,也可以看做激励,所以它们都可以在一个语句块中实现。也可以拿自校验的结果,作为结束仿真的条件。
实际仿真时,可以根据自己的个人习惯来编写 testbench,这里只是做一份个人的总结。
2. testbench 仿真举例
前面的章节中,已经写过很多的 testbench。其实它们的结构也都大致相同。
下面,我们举一个数据拼接的简单例子,对 testbench 再做一个具体的分析。
一个 2bit 数据拼接成 8bit 数据的功能模块描述如下:
module data_consolidation ( input clk , input rstn , input [1:0] din , //data in input din_en , output [7:0] dout , output dout_en //data out ); // data shift and counter reg [7:0] data_r ; reg [1:0] state_cnt ; always @(posedge clk or negedge rstn) begin if (!rstn) begin state_cnt <= 'b0 ; data_r <= 'b0 ; end else if (din_en) begin state_cnt <= state_cnt + 1'b1 ; //数据计数 data_r <= {data_r[5:0], din} ; //数据拼接 end else begin state_cnt <= 'b0 ; end end assign dout = data_r ; // data output en reg dout_en_r ; always @(posedge clk or negedge rstn) begin if (!rstn) begin dout_en_r <= 'b0 ; end //计数为 3 且第 4 个数据输入时,同步输出数据输出使能信号 else if (state_cnt == 2'd3 & din_en) begin dout_en_r <= 1'b1 ; end else begin dout_en_r <= 1'b0 ; end end //这里不直接声明dout_en为reg变量,而是用相关寄存器对其进行assign赋值 assign dout_en = dout_en_r; endmodule
对应的 testbench 描述如下,增加了文件读写的语句:
`timescale 1ns/1ps //============== (1) ================== //signals declaration module test ; reg clk; reg rstn ; reg [1:0] din ; reg din_en ; wire [7:0] dout ; wire dout_en ; //============== (2) ================== //clock generating real CYCLE_200MHz = 5 ; // always begin clk = 0 ; #(CYCLE_200MHz/2) ; clk = 1 ; #(CYCLE_200MHz/2) ; end //============== (3) ================== //reset generating initial begin rstn = 1'b0 ; #8 rstn = 1'b1 ; end //============== (4) ================== //motivation int fd_rd ; reg [7:0] data_in_temp ; //for self check reg [15:0] read_temp ; //8bit ascii data, 8bit \n initial begin din_en = 1'b0 ; //(4.1) din = 'b0 ; open_file("../tb/data_in.dat", "r", fd_rd); //(4.2) wait (rstn) ; //(4.3) # CYCLE_200MHz ; //read data from file while (! $feof(fd_rd) ) begin //(4.4) @(negedge clk) ; $fread(read_temp, fd_rd); din = read_temp[9:8] ; data_in_temp = {data_in_temp[5:0], din} ; din_en = 1'b1 ; end //stop data @(posedge clk) ; //(4.5) #2 din_en = 1'b0 ; end //open task task open_file; input string file_dir_name ; input string rw ; output int fd ; fd = $fopen(file_dir_name, rw); if (! fd) begin $display("--- iii --- Failed to open file: %s", file_dir_name); end else begin $display("--- iii --- %s has been opened successfully.", file_dir_name); end endtask //============== (5) ================== //module instantiation data_consolidation u_data_process ( .clk (clk), .rstn (rstn), .din (din), .din_en (din_en), .dout (dout), .dout_en (dout_en) ); //============== (6) ================== //auto check reg [7:0] err_cnt ; int fd_wr ; initial begin err_cnt = 'b0 ; open_file("../tb/data_out.dat", "w", fd_wr); forever begin @(negedge clk) ; if (dout_en) begin $fdisplay(fd_wr, "%h", dout); end end end always @(posedge clk) begin #1 ; if (dout_en) begin if (data_in_temp != dout) begin err_cnt = err_cnt + 1'b1 ; end end end //============== (7) ================== //simulation finish always begin #100; if ($time >= 10000) begin if (!err_cnt) begin $display("-------------------------------------"); $display("Data process is OK!!!"); $display("-------------------------------------"); end else begin $display("-------------------------------------"); $display("Error occurs in data process!!!"); $display("-------------------------------------"); end #1 ; $finish ; end end endmodule // test
仿真结果如下。由图可知,数据整合功能的设计符合要求:
3. testbench 具体分析
1)信号声明
testbench 模块声明时,一般不需要声明端口。因为激励信号一般都在 testbench 模块内部,没有外部信号。
声明的变量应该能全部对应被测试模块的端口。当然,变量不一定要与被测试模块端口名字一样。但是被测试模块输入端对应的变量应该声明为 reg 型,如 clk,rstn 等,输出端对应的变量应该声明为 wire 型,如 dout,dout_en。
2)时钟生成
生成时钟的方式有很多种,例如以下两种生成方式也可以借鉴。
initial clk = 0 ; always #(CYCLE_200MHz/2) clk = ~clk; initial begin clk = 0 ; forever begin #(CYCLE_200MHz/2) clk = ~clk; end end
需要注意的是,利用取反方法产生时钟时,一定要给 clk 寄存器赋初值。
利用参数的方法去指定时间延迟时,如果延时参数为浮点数,该参数不要声明为 parameter 类型。例如实例中变量 CYCLE_200MHz 的值为 2.5。如果其变量类型为 parameter,最后生成的时钟周期很可能就是 4ns。当然,timescale 的精度也需要提高,单位和精度不能一样,否则小数部分的时间延迟赋值也将不起作用。
3)复位生成
复位逻辑比较简单,一般赋初值为 0,再经过一段小延迟后,复位为 1 即可。
这里大多数的仿真都是用的低有效复位。
4)激励部分
激励部分该产生怎样的输入信号,是根据被测模块的需要来设计的。
本次实例中:
- (4.1) 对被测模块的输入信号进行一个初始化,防止不确定值 X 的出现。激励数据的产生,我们需要从数据文件内读入。
- (4.2) 处利用一个 task 去打开一个文件,只要指定文件存在,就可以得到一个不为 0 的句柄信号 fp_rd。fp_rd 指定了文件数据的起始地址。
- (4.3) 的操作是为了等待复位后,系统有一个安全稳定的可测试状态。
- (4.4) 开始循环读数据、给激励。在时钟下降沿送出数据,是为了被测试模块能更好的在上升沿采样数据。
利用系统任务 $fread ,通过句柄信号 fd_rd 将读取的 16bit 数据变量送入到 read_temp 缓存。
输入数据文件前几个数据截图如下。因为 $fread 只能读取 2 进制文件,所以输入文件的第一行对应的 ASCII 码应该是 330a,所以我们想要得到文件里的数据 3,应该取变量 read_temp 的第 9 到第 8bit 位的数据。
信号 data_in_temp 是对输入数据信号的一个紧随的整合,后面校验模块会以此为参考,来判断仿真是否正常,模块设计是否正确。
- (4.5) 选择在时钟上升沿延迟 2 个周期后停止输入数据,是为了被测试模块能够正常的采样到最后一个数据使能信号,并对数据进行正常的整合。
当数据量相对较少时,可以利用 Verilog 中的系统任务 $readmemh 来按行直接读取 16 进制数据。保持文件 data_in.dat 内数据和格式不变,则该激励部分可以描述为:
reg [1:0] data_mem [39:0] ; reg [7:0] data_in_temp ; //for self check integer k1 ; initial begin din_en = 1'b0 ; din = 'b0 ; $readmemh("../tb/data_in.dat", data_mem); wait (rstn) ; # CYCLE_200MHz ; //read data from file for(k1=0; k1<40; k1=k1+1) begin @(negedge clk) ; din = data_mem[k1] ; data_in_temp = {data_in_temp[5:0], din} ; din_en = 1'b1 ; end //stop data @(posedge clk) ; #2 din_en = 1'b0 ; end
5)模块例化
这里利用 testbench 开始声明的信号变量,对被测试模块进行例化连接。
6)自校验
如果设计比较简单,完全可以通过输入、输出信号的波形来确定设计是否正确,此部分完全可以删除。如果数据很多,有时候拿肉眼观察并不能对设计的正确性进行一个有效判定。此时加入一个自校验模块,会大大增加仿真的效率。
实例中,我们会在数据输出使能 dout_en 有效时,对输出数据 dout 与参考数据 read_temp(激励部分产生)做一个对比,并将对比结果置于信号 err_cnt 中。最后就可以通过观察 err_cnt 信号是否为 0 来直观的对设计的正确性进行判断。
当然如实例中所示,我们也可以将数据写入到对应文件中,利用其他方式做对比。
7)结束仿真
如果我们不加入结束仿真部分,仿真就会无限制的运行下去,波形太长有时候并不方便分析。Verilog 中提供了系统任务 $finish 来停止仿真。
停止仿真之前,可以将自校验的结果,通过系统任务 $display 在终端进行显示。
4. 文件读写选项
用于打开文件的系统任务 $fopen 格式如下:
fd = $fopen("<name_of_file>", "mode")
和 C 语言类似,打开方式的选项 "mode" 意义如下:
r | 只读打开一个文本文件,只允许读数据。 |
---|---|
w | 只写打开一个文本文件,只允许写数据。如果文件存在,则原文件内容会被删除。如果文件不存在,则创建新文件。 |
a | 追加打开一个文本文件,并在文件末尾写数据。如果文件如果文件不存在,则创建新文件。 |
rb | 只读打开一个二进制文件,只允许读数据。 |
wb | 只写打开或建立一个二进制文件,只允许写数据。 |
ab | 追加打开一个二进制文件,并在文件末尾写数据。 |
r+ | 读写打开一个文本文件,允许读和写 |
w+ | 读写打开或建立一个文本文件,允许读写。如果文件存在,则原文件内容会被删除。如果文件不存在,则创建新文件。 |
a+ | 读写打开一个文本文件,允许读和写。如果文件不存在,则创建新文件。读取文件会从文件起始地址的开始,写入只能是追加模式。 |
rb+ | 读写打开一个二进制文本文件,功能与 "r+" 类似。 |
wb+ | 读写打开或建立一个二进制文本文件,功能与 "w+" 类似。 |
ab+ | 读写打开一个二进制文本文件,功能与 "a+" 类似。 |
硬件描述语言的一个突出优点就是指令执行的并行性。多条语句能够在相同时钟周期内并行处理多个信号数据。但是当数据串行输入时,指令执行的并行性并不能体现出其优势。而且很多时候有些计算并不能在一个或两个时钟周期内执行完毕,如果每次输入的串行数据都需要等待上一次计算执行完毕后才能开启下一次的计算,那效率是相当低的。流水线就是解决多周期下串行数据计算效率低的问题。