Correlations between Word Vector Sets
どんな論文?
文表現の変数を潜在空間の次元1つ1つに対してトークン数次元を持つデータのサンプリングとして捉えることで、計量に相関係数を導入した論文。poolingして文の表現を作成するアプローチとカーネルによる直接計算を行っている。
新規性
2pairのd次元統計と考え、poolingと計量の方法を比べた点とカーネルを使用しそのまま文を比較する方法を提案したこと。
結果
max-poolingとロバストな相関係数を使用することで、STSタスクの多くにおいてでのピアソン相関が向上。さらに、カーネルを使用する方法は、STSタスクの年代によっては、ピアソン相関が向上。
次に読むべき論文
- Arthur Gretton, Olivier Bousquet, Alex Smola, and Bernhard Sch¨olkopf. 2005a. Measuring statistical dependence with hilbert-schmidt norms. In Inter- national conference on algorithmic learning theory, pages 63–77. Springer.
- Arthur Gretton, Ralf Herbrich, Alexander Smola, Olivier Bousquet, and Bernhard Sch¨olkopf. 2005b. Kernel methods for measuring independence. Jour- nal of Machine Learning Research, 6(Dec):2075– 2129.