论文概要
主要描述一下该论文 column attention。
Sequence-to-set
直观地说,where 子句中出现的列名是所有列名的子集。因此,我们可以仅仅预测子集中的列名,而不是生成列名序列(博主注:他的意思可能是,不要将 sql 语句中 "select Column A, Column B, Column C..." 的 "Column A, Column B, Column C..." 当做生成序列的任务,而是将其当做 slot filling)。我们把这个想法称为 sequence-to-set 的预测。 尤其是我们计算 \(P_{wherecol}(col|Q)\),其中 col 是列名,q 是自然语言问题。为此,将计算 \(P_{wherecol}(col|Q)\) 表达为 \[
P_{wherecol}(col|Q) = \sigma(u^T_c E_{col} + u^T_q E_Q)
\] 其中 \(\sigma\) 是 sigmoid 函数,\(E_{col}\) 和 \(E_Q\) 分别是 column name 和自然语言问题的嵌入, \(u_c\) 和 \(u_q\) 是两个可训练的列向量。。。(后面还有一大段话省略了,主要看 column attention)