研究内容 – 東京大学　言語情報科学専攻　林研究室

研究内容

Research

研究室では、テキスト・動画像・音声などを組み合わせたマルチモーダルな言語処理・知識処理を研究として進めています。「自然言語処理」「機械学習（特にランキング学習）」「知識処理」「データベース」などのトップ国際会議採択や受賞の豊富な実績があります。近年では、以下のようなプロジェクトを進めています。

大規模言語モデルの推論手法
- 情報検索や推薦用のランキングアルゴリズム
- ベイズ最小化復号
- 知識情報の活用
マルチモーダル言語モデルの応用
- マンガ生成用のプロット・レイアウトデータ作成
- メタファープロンプトによる画像生成
低資源言語
- アイヌ語の音声言語処理
歌詞生成と韻律論
- 有限状態トランスデューサによるモデル化

また、「文字・文字列・言語研究会（駒場）」を東京大学の学生と立ち上げました。系列データに関わる理論・応用研究について検討しています。

理論面：形式言語、データベース、離散アルゴリズム、データ構造、機械学習の観点から系列データ処理を検討しています。
応用面：大規模コーパス、大規模ゲノム配列データ、低資源言語データ（古典籍・暗号文書・消滅危機言語など）に関連した諸課題を検討しています。

教養学部における学際言語科学コース、または、総合情報学コース（学際B）から学生の配属が可能であり、大学院では総合文化研究科における言語情報科学専攻から配属が可能となっています。社会人の方も歓迎しますので、気軽にご相談ください。

配属希望の方は必ず事前にメールで問い合わせください。留学生の方は、研究生・大学院生での受験に、原則として、日本語能力試験（JLPT）N1の資格が必要となりますので、ご注意ください。

学生の研究教育を主な目的としたハッカソンを他大学・民間企業との共同研究で企画しており、学生の希望に応じて参加いただくこともできます。

開発したツールやデータは研究室GitHubから随時公開します。