网站地图官方微信:
网站首页 包装制品 包装检测设备 帐簿 语音室成套设备 隐型眼镜 眼镜片

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 软路由怎么没有人玩了? |

    本文来自专栏VHDX 19英寸机柜de奇幻漂流2017年,还...

    查看详情>>
  • | 预测一下,下一次阅兵会出现什么武器震惊世界? |

  • | 闲鱼上为什么会有人问都不问直接下单? |

  • | 为何 Linus 一个人就能写出这么强的系统,中国却做不出来? |

  • | 一个练过功夫的姑娘能打过一个没练过的男人吗? |

  • | 为什么韩国的热辣舞团无法征服中国的男性市场?? |

  • | 俗话说“女人三十如狼四十如虎”,到底是不是真的?? |

  • | 敢不敢发一张你的自拍照? |

  • | 为什么运维都这么难招? |

  • | 现在的年轻人喜欢穿连裤袜吗? |

  • | CPU 为什么很少会坏? |

  • 正好,我在写一个.net core的小服务程序,正好用手头的...

    2025-06-21
  • 仔细看这个动图 菲有个一闪而过的微微撇嘴小白眼的表情 之后马...

    2025-06-21
  • 流浪地球的细节,真实到了恐怖的程度!作为医生,对医院的细节比...

    2025-06-21
  • 当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最...

    2025-06-21

关注我们

添加微信好友,关注最新动态