不懂就问:
已知:DDR3 792 MHz
OpenPPL在https://zhuanlan.zhihu.com/p/474684731提到访存带宽是2.727 GB/s ;
我自测,用memcpy测的话,数据传输速度能达到是2.028GB/s;
单独用flw指令测试,结果是2.592GB/s。
问:DDR3是792 MHz,访存带宽和它是什么关系呢?
问:OpenPPL的2.727GB/s是怎么测出来的?我实验vlw的速度比flw指令是慢的,难道还有比flw更快的指令?
不懂就问:
已知:DDR3 792 MHz
OpenPPL在https://zhuanlan.zhihu.com/p/474684731提到访存带宽是2.727 GB/s ;
我自测,用memcpy测的话,数据传输速度能达到是2.028GB/s;
单独用flw指令测试,结果是2.592GB/s。
问:DDR3是792 MHz,访存带宽和它是什么关系呢?
问:OpenPPL的2.727GB/s是怎么测出来的?我实验vlw的速度比flw指令是慢的,难道还有比flw更快的指令?
@aozima 多谢解答,另外想再问一下,计算和访存不能并行,这个意思是计算和访存不能双发射,但是他们有各自的流水线对吧?
最近写riscv算子的过程中发现这么一个问题:
比如:
在c文件里定义一个数组a[10]
调用汇编文件里的test函数
汇编文件的test函数根据入参数组a进行数据读写操作,即使超过了数组a的范围,也能够正常读写且不报错。(编译运行都不会报错)
这很危险啊,尤其是写操作会影响到非a数组地址内的内容。
ps:我用的是riscv-v的指令
可以暂时不要关注为什么汇编会越界访问~
在这里看到C906处理器算力可达 4GFlops(@1GHz)。
哪吒D1的riscv的算力是 4GFlops吗?
有没有办法看板子目前的主频是多少啊?