Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Long Text Generation via Adversarial Training with Leaked Information(AAAI 2018) #13

Open
juravrik opened this issue May 11, 2019 · 0 comments

Comments

@juravrik
Copy link

juravrik commented May 11, 2019

0. 論文

タイトル: Long Text Generation via Adversarial Training with Leaked Information
リンク: https://arxiv.org/abs/1709.08624
著者: Jiaxian Guo, Sidi Lu, Han Cai, Weinan Zhang, Yong Yu, Jun Wang
所属: Shanghai Jiao Tong University, University College London
発表年: 2018
掲載: AAAI

1. どんなもの?

Discriminator内で抽出された特徴量をGeneratorで利用することで特に長文において高品質なテキストの生成に成功
table6

2. 先行研究と比べてどこがすごい?

強化学習を用いたGANによるテキスト生成において従来手法では特に長文の生成時報酬がめったに得られないことにより学習が困難であるという問題があった。
そこで階層型強化学習を利用し、Discriminatorの中間特徴を取り込むManagerモジュールとテキスト生成を行うWorkerモジュールのふたつでGeneratorを構成することで効率的な学習を実現した。

3. 技術や手法のキモはどこ?

fig3 1

Leaked Features from D as Guiding Signals

DiscriminatorにはCNNを使用し最終層の直前の特徴量をManagerにLeakさせる。
これにより二値の分類情報よりも多くの情報をGeneratorが利用できるようになる

Hierarchical Structure of G

Managerの目的はLeakされた情報から生成をガイドする有効な表現を獲得することにある。
Managerの勾配は以下のような現在のpolicyから推定される報酬Qを用いて以下のように定義される。
eq7
Workerは以下の報酬を最大化するよう学習する。
eq8
ManegerとWorkerの学習は別々に行う。

4. どうやって有効だと検証した?

先行研究であるSeqGAN及びRankGANと比較。
使用データセットは3種類。

  • WMT News: 長文として使用
  • COCO Image: Captions: 中間として使用
  • Chinese Poems: 短文として使用
    これらについてBLEUスコアで評価。またCOCOとWMTについては人手での評価も行った。

table5 2

長文であっても高い性能を実現している。

fig5 3

テキスト長ごとのLeakGANとのBLEUスコア差のグラフからも長文に対する強さがうかがえる

5. 議論はある?

  • 全結合層で階層構造を置き換えようとしたところ学習が不安定になりうまくいかなかった
  • 強化学習を用いたテキスト生成GANは基本的に学習が難しい

6. 次に読むべき論文は?

コメント

FMGAN論文の比較実験をみるとself-BLEUスコアが一貫してかなり高く、Leakさせていることもあり生成テキストの多様性に欠けているんじゃないかと思った

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant