帰省一日目だったがいつも通り 6 時に起きた.昨晩ちゃんと寝て目覚めが良かったので朝から研究用コードを書き始めた.新しいプロジェクトなのでデータをとってきて簡単な処理を書いた. 初めて Haggingface Datasets という,いろんなデータセットをロードするための便利関数が用意されているライブラリを使ってみたのだが非常に使いやすい.transformers ライブラリを作っている huggingface がリードしているライブラリなので,bert とかの学習用にインターフェイスが整理されているしサンプルコードも十分に用意されているのですぐに実装することができた.
日中はバイトの仕事納めだった.特別なタスクはなかったので通常通りの営業だったので安定して作業を進めることができたが,進捗的に微妙なところで時間切れになってしまった.まあログはちゃんと残しているので来年の仕事始め(4 日)からすんなりまた再開できることを願う.
仕事後は,実験用のコードの朝の続きを少し進めた.baseline となる実装は完了して実行はできることは確認できたのだが,GPU がないとやはり実際に学習がうまくいくかはわからない.まあ,すごく基本的なモデルなので問題ない気がしているが. 休暇中時間があるのにここで停滞するのはもったいないので,提案手法の実装も試すことはできないが進めて行こうかな. せっかく時間があるので,綺麗に書いていきたいな.テストとかも書きたいが,パラメータを持ったモデルのテストをどうかくのかがわからん.行列のサイズだけとりあえずチェックして行ったら良いのだろうか.でもそれが間違っていたらそもそもコードが動かない気もするが.AllenNLP はテストが書かれているという噂を聞いたことがあるので目を通してみてもいいのかもしれない.
この実験コードをどれくらいちゃんと書くのかってのは悩みどころ.大学院時代は無駄に凝って割と綺麗にいろんな実装をしていたのだが,結果として実験の手数を増やすことができないという本末転倒な結果になったのでそれは避けたい.でもいざ書き始めると細かいところが気になってしまう.