テクノロジー
【23卒】初めての国際学会体験記【自然言語処理学会】
こんにちは。
2023年にデータサイエンティストとしてマイナビに入社をしたH・Hです。
この度、イギリスのダービー大学で開催された国際学会である自然言語処理学会に登壇をして来ました。
今回は参加の経緯と参加レポについて記載をさせていただきます。
主な流れ
時間 | 内容 |
---|---|
2月上旬 | 国際学会提出に誘われる |
3月30日 | 論文提出 |
4月25日 | 査読通過 |
5月23日~6月19日 | スライド作成+発表練習 |
6月19日 | イギリスへ! |
6月21日 | 発表! |
6月25日 | 日本に帰国 |
自分の研究について
概要
元々、Web上のデータはなかなか解析が進んでいないと思っていました。様々なデータがある中でWeb上ではオープンに学ぶことが出来ます。機械学習をさせることで精度が高い解析ができるのではないかと考えました。
自分の研究テーマは[機械学習によるTwitterユーザーの性別予測]です。
X(旧:Twitter)で投稿されたテキストや画像をもとに投稿したユーザーの性別を予測していきます。
例えばある商品について「いいね!」をしている人や自分をフォローしている人の性別を知ることで今後のマーケティング戦略につながるといった社会的目的も叶えることが出来ると思いました。
その中でも新規性として、性別をTwitterの外のサービスを用いて自動にラベル付けを行うことで、機械学習する際に人の手間を排除した方法を行い、十分な精度を出しました。
具体的には日本人では約2万人いると言われているX(旧:Twitter)のフォロワー数1万人以上の人に対してWikipedia等Web上の情報を用い、ラベル付けをすることができた6000人~7000人を学習させていきました。
大変だったこと
ラベル付けについてなかなか精度を上げることが出来ず非常に苦労をしました。
画像の添付が有るときと無いときのデータに対してどのような対応をすべきか?等考えることが沢山あります。
最初に作ったモデルだと上手に行かず、いろいろなモデルを作っては試し、また作っては試し…と何度も繰り返しました。
また、データ数も非常に多く、1回の取得に2週間以上かかるものもあり回収が非常に難しかったです
参加のきっかけ
最初は卒業年である2023年の1,2月ごろ、研究室内で自分の研究内容を発表したときに助教授の方から「君の研究内容は面白い。近日、君に当てはまるテーマでの学会発表がイギリスであるから提出してみたら?」と提案を受けたのがきっかけです。
自分は英語がかなり苦手であまり積極的ではなかったのですが、サポートをしてくれるという言葉から提出に踏み切りました。助教授のアドバイスの元、卒論や、国内学会発表とは内容と差別化を図るように注目する点を少し変えて、結論をまとめていきました。
追加実験や論文をまとめ上げ3月30日に提出をしました。
査読が通った後
提出を終えたのち大学院を卒業し、はれてマイナビに入社し新入社員研修をしていた4月25日に査読が通り、掲載されることが決まりました。その時は研修と発表準備の両立への不安と、英語が本当に苦手という意識から、自分はイギリスにはいかず、発表は助教授に任せようと考えていました。ただ同期の仲間に背中を押され5月の中旬にようやく学会発表をすることを決意しました。
イギリスへ
そこからはスライド、発表資料の作成を行い、複数回のミーティングと元研究室のみんなにも協力してもらいながら発表練習を複数回繰り返しました。(と言いつつもカンニングペーパーを作成しそれを間違えないように発音することで精一杯でした…)
それから、初めてのヨーロッパということで移動、宿泊の準備もしていきました。
イギリスに到着してからもぎりぎりまで内容の確認を行い発表に臨みました。
学会発表
正直緊張して何も覚えていません(笑)
博士課程の方や大学教授レベルの方が非常に多く、ほぼ最年少での参加でした。
自分は、言葉を間違えないように必死で、ほとんどスライドを見ていました。
質疑応答の場面では周りの助けもありながらなんとか返答することができました。
中でも、「性の多様化が進んでいるなかで男女のみに絞ったのですか?」という質問に対しては「先行研究と比較するため男女のみに絞りました。」としか答えることができず、性別に関する認識を甘く見られていた点を突かれてしまいました。
他の人の発表を聞いて自分では考慮しきれなかった絵文字を含んだ文章解析など独自の視点による解析が多くあり視野が広がりました。
振り返り
結論として、とても楽しかったです!参加して本当に良かったと思います!
最初は英語が苦手で、発表もけして大成功とはいえない結果でしたが、文化的にも、技術的にも多くの経験をさせてもらいました。特に、多くの国籍の方が発表していたので、注目する視点や、問題の定義にも個性が出ており、多様な物事の視点を獲得できた気がしています。
また、よく見ていた論文サイトで自分の論文が見れるようになっていてとても興奮しました!
もっと時間があれば性別だけでなく年齢や出身地も予測したいなと思っていました。ただ研究をしていくうちに「データ」そのものへの興味が湧いてきたのです。なので、これからマイナビでデータサイエンティストとして活躍できるよう、頑張っていきたいと思います!!
※本記事は2023年09月時点の内容です。