pytorch中嵌入的加权求和
由 fearum发布于

我有一个12个单词的序列,我使用12x256矩阵表示(使用单词嵌入)。让我们称这些为。我希望以此为输入并输出1x256向量。但是我不想使用(12x256)x 256的密集层。相反,我想使用12个嵌入的加权总和来创建输出嵌入

wi是标量(因此有权重)。

如何在pytorch中创建可训练的wi?我是新手,只熟悉nn.Linear等标准模块。