ストップワードをどう制定するかを考えていた. Slothlibに入っているやつをそのまま使えば, とりあえずはいいのかもしれないけど,データセットごとに有用なものも追加したい. 頻度順で表示してみたり,tf-idf のスコアでソートしてみて選んだりもしてみたが,攻めのストップワードを制定するためには, いろいろ実際にモデルの評価までやって試してみる必要がありそうで,それは計算時間的にめんどくさい. この論文では, 選択を進化アルゴリズムを使って最適化するための手法が提案されているっぽい.

発表する予定の論文読み会のイベントページが公開された

YouTube Live を使ったオンラインでの開催となります。

とあ裏,youtube live というシステムがよくわからないが,youtuber デビューになるんだろうか. もっとプライベートなものかと思っていた.

“Knowledge Supports Visual Language Grounding: A Case Study on Colour Terms”

を読む予定.技術的に新しいものがあるわけではないが,人の認知構造を考慮したモデルを試しており,直感的な結果を得ていて興味深い論文だと思う. 発表資料を作らないと. しばらくスライドというか,人に見せるための資料なんて作っていないので時間がかかりそう.