网站地图官方微信:
网站首页 包装生产线 包装检测设备 包装成型机械 圆珠笔 眼镜及配件 学习机

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 男朋友要被裁员了,我该怎么相处? |

    想起了我失业的时候,一共在家待了6个月。 在我辞职的当月,我...

    查看详情>>
  • | 家用小型服务器用什么系统比较好呢? |

  • | 机械硬盘2025年是什么行情? |

  • | 如何看待俄罗斯军方 6 月 23 日凌晨向基辅方向发射了352架无人机和16枚“伊斯坎德尔”导弹? |

  • | 怎么评价国内AI企业人肉背15块80TB硬盘,飞去马来西亚用英伟达训练数据,以规避美国禁令? |

  • | 河南一带的农村到底有多穷? |

  • | 为什么果粉对苹果非常地宽容? |

  • | PHP现在真的已经过时了吗? |

  • | 为什么新流行的开源编辑器都在用Rust开发? |

  • | 新婚那天晚上你们是怎样度过的? |

  • | 目前中国程序员和美国程序员的差距在哪里? |

  • 有女朋友的人基本都懂,衣服这种东西,本质是遮丑用的。 一个...

    2025-06-26
  • 我得让你看看一些可能让你感到不悦的东西: CREATE TA...

    2025-06-26
  • 有几个答主提到点上了,国外 nodejs 之所以盛行,是因为...

    2025-06-26
  • 我朋友是Jarred 的好友兼他的Zig 老師。 當然成為...

    2025-06-26

关注我们

添加微信好友,关注最新动态