科目名[英文名]
知能情報システム工学特別講義(自然言語処理)   [Special Lecture on Electrical Engineering and Computer Science ( )]
区分 工学部専門科目  選択必修   単位数 2 
対象学科等   対象年次 34  開講時期 3学期 
授業形態 3学期  時間割番号 023696
責任教員 [ローマ字表記]
古宮 嘉那子   [KOMIYA Kanako]
所属 生物システム応用科学府 研究室   メールアドレス

概要
本講義では、自然言語処理に関する古典的な手法と、機械学習の基礎について学んだあと、深層学習の基礎についても述べる。まず、1-3回で、機械学習やデータマイニングの基礎について概観し、4-8回で自然言語処理の古典的な上流処理について学ぶ。9回と10回では文書分類と分類問題について概観し、11-14回で様々なタスクを見据えたアルゴリズムについて学ぶ。最後に、現代の自然言語処理の理解に欠かせない、深層学習の基礎となる、ニューラルネットワークについて触れる。

クラスコード:h7tmzad(2022/9/20訂正) 
到達基準
自然言語処理にはどういった問題(タスク)があるのか、またそれぞれに関してどのようなアルゴリズムで解いているのかについて学ぶ。深層学習以前の古典的な上流、下流処理について学んだうえで、深層学習の基礎について学ぶ。
授業内容
1 ガイダンス
2 機械学習序論
3 回帰分析
4 形態素解析1(確率の計算) 【小テスト】
5 形態素解析2(Viterbi) 【小テスト】
6 構文解析(句構造文法) 【小テスト】
7 構文解析2(EM)
8 意味解析(シソーラスを用いた語義曖昧性解消) 【小テスト】
9 文書分類 【小テスト】
10 ベクトル空間モデルと分類問題(SVM)
11 決定木学習とPrefix Span 【小テスト】
12 統計的機械翻訳
13 情報抽出【小テスト】
14 対話システム、質問応答、推薦システム【小テスト】
15 深層学習の基礎(ニューラルネットワーク) 【小テスト】
履修条件・関連項目
プログラミングの基礎については理解しているものとして授業は進む。
人工知能、データマイニングに関する授業は受けていることが望ましいが、初歩から説明を行う。
テキスト・教科書
『新納浩幸,古宮嘉那子,文書分類から始める自然言語処理入門 基礎からBERTまで,科学情報出版,(2022,07).』の1,3,4章は本講義と一致する。また、授業中、プログラミングについてはあまり述べないが、課題はプログラミングを求める。その説明は本書にある。

また、『柴原 一友 (著), 築地 毅 (著), 古宮 嘉那子 (著), 宮武孝尚 (著), 小谷 善行 (著),機械学習教本,森北出版,2019年』の2-5章は授業の理解に役に立つ。

(購入は必須ではない)
参考書
『柴原 一友 (著), 築地 毅 (著), 古宮 嘉那子 (著), 宮武孝尚 (著), 小谷 善行 (著),機械学習教本,森北出版,2019年』
『高村大也(著),言語処理のための機械学習入門,コロナ社,2010年』
成績評価の方法
小テストの提出状況(30%)および期末レポート(70%)による。
授業中にはアルゴリズムの説明を行うが、ツールの使い方の説明は行わない。しかし、期末レポートでは機械学習ツールを利用することになるため、この勉強は自分で行うこと。簡単なMeCabなどのツールでも可(exeファイルあり)だが、高得点を狙うならsk-learnなどを動かしてみるとよい。
教員から一言
キーワード
自然言語処理、機械学習
オフィスアワー
オンライン授業の間は、基本的にはメールで質問をしてください。メールで伝わらない場合には、zoomでミーティングします。
備考1
備考2
参照ホームページ
開講言語
日本語
語学学習科目
更新日付
2022/09/20 17:25:04