
Information Bottleneckを使用して、ELMOをparsingに特化したベクトルに変換する手法。

Figure 1


  • information bottleneckを使って、embedingを特化させる点
  • 推定方法の色々な工夫
  • parsingの部分だけを取り出すため、layer-0の相互情報量で、正規化


  1. bottle-neckに閾値があり、ある点から急に精度が下がる。
  2. 適度に絞ると、posタグごとに分散表現が別れる(fig2)
  3. 離散的なタグをbottle-neckにすると、posタグと相関がある
  4. ELMOそのままや、他の圧縮手法に比べ、parsingの精度が9言語中8つで向上した。(table1)

Figure 2

Table 1


  推定方法
  IBの性質
  contextualized word vectorの性質
