今日も雨のため朝散歩できず. 早朝は雨だけではなくて,流星も空を通ったらしい.
今日から,日記のタイトルをただ起こったことを 5-7-5 っぽく描くのではなく,日々の自分の学びを記していきたいと朝思ったのだが, そんな日に限って,バタバタと一日を過ごしてしまい,内省の時間が取れなかった.
なので最近読んだ論文を載せる.
semi-supervised gan のフレームワークに乗っ取って bert でテキスト分類を行うことで,ラベルの付いていないデータを有効活用し, ラベル付きのデータは少量であっても性能が高くなる,という内容. タイトルの破壊力から疑いの目で読んでいたが面白かった.
最近,似たような状況 - ラベルなし同一ドメインデータはある程度手に入るが,ラベル付きが少ない - に遭遇していたので,フレームワークとして参考にできるかもしれない. というよりも,分類器のビジネス利用では大体同じようなかんじな気がする.