网站地图官方微信:
网站首页 包装生产线 一体机办公设备 夜视仪 眼镜架 眼镜及配件 学习文具

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别? |

    类比一下,如果把「安装程序到你的电脑」比作「将钱存入你的银行...

    查看详情>>
  • | 坐标福建福州,现在是不是适合卖房? |

  • | 湖南卫视究竟是一个怎样的存在? |

  • | springboot框架中一个controller类可以调用多个service类吗? |

  • | 平面设计师要被时代淘汰了吗? |

  • | 网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)? |

  • | 如果公司规定一个月连上22天,接着连休8天,你会同意吗? |

  • | 大三了,应该去做运维还是去J***a后端呢? |

  • | 为什么年轻人不要养龟? |

  • | 为什么 macOS 比 Windows 稳定? |

  • | 搞了NAS之后去哪里下载4K,8K的电影? |

  • 住在京都好几年了,京都有个著名的拉面激战区一乘寺,粗算周边应...

    2025-06-25
  • 8K之后是16K,但个人认为16K可能遥遥无期,毕竟8K都还...

    2025-06-25
  • 以pc游戏为主的国内市场压根不应该认为QHD(2560*14...

    2025-06-25
  • Golang 团队从系统调用开始,从头搓了一套,什么都不依赖...

    2025-06-25

关注我们

添加微信好友,关注最新动态