导航

    全志在线开发者论坛

    • 注册
    • 登录
    • 搜索
    • 版块
    • 话题
    • 在线文档
    • 社区主页

    求证:riscv的计算与访存无法并行吗?

    MR Series
    3
    6
    2529
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • Z
      zhaodongyu LV 4 最后由 编辑

      Screenshot 2023-05-31 at 17.15.23.png

      如图,D1上的riscv的计算与访存流水线无法并存?这个结论是怎么得到的呢?

      aozima 1 条回复 最后回复 回复 引用 分享 0
      • aozima
        aozima LV 7 @zhaodongyu 最后由 编辑

        访存有专门的Load/Store指令,这样计算的指令都是直接基于寄存器的,更加简单些。

        Z 1 条回复 最后回复 回复 引用 分享 0
        • Z
          zhaodongyu LV 4 @aozima 最后由 编辑

          @aozima 那计算和访存流水线是串行的对吗?

          aozima 1 条回复 最后回复 回复 引用 分享 0
          • aozima
            aozima LV 7 @zhaodongyu 最后由 编辑

            @zhaodongyu 逻辑上看起来是的,实际上有预取,write buffer等特性存在,所以在计算时,访存已提前进行,或上条还未完成,不会等的。

            Z 1 条回复 最后回复 回复 引用 分享 0
            • Z
              zhaodongyu LV 4 @aozima 最后由 编辑

              @aozima 多谢解答,另外想再问一下,计算和访存不能并行,这个意思是计算和访存不能双发射,但是他们有各自的流水线对吧?

              C 1 条回复 最后回复 回复 引用 分享 0
              • C
                caozilong LV 5 @zhaodongyu 最后由 编辑

                @zhaodongyu
                感觉它这里针对的是GEMM KERNEL加速核的设计而言的,PPT标题已经给出来了。对经典的CPU流水线来讲,计算阶段和访问阶段已经流水化了,由不同的硬件(ALU/BIU)完成,本身是可以做到并行的。而用计算来掩盖访存延迟一般是HPC计算加速器的做法,因为这种KERNEL 加速器不像CPU有丰富的L1/L2/L3缓存可以用,CPU访存延迟低。计算加速器只能通过大量计算掩盖访存延迟。所以我感觉它这里讲的可能不是RISC-V的特性,而是GEMM阵列的特性。

                1 条回复 最后回复 回复 引用 分享 0
                • 1 / 1
                • First post
                  Last post

                Copyright © 2024 深圳全志在线有限公司 粤ICP备2021084185号 粤公网安备44030502007680号

                行为准则 | 用户协议 | 隐私权政策