科目名 |
国語学特論II |
クラス |
− |
授業の概要 |
コーパスと呼ばれる、実際に使用された言語データをもとに、日本語の特性について様々な角度から分析を行う。大量のテキストデータから、統計的な技法を駆使して価値あるデータを取り出すテキストマイニングの手法を身に着ける。 |
授業の到達目標 |
コンピュータを使って日本語を分析することを通して、コンピュータの操作に習熟し、GREP、Excel、仮説的統計検定の技法を身につける |
授業計画 |
※複数教員が担当する授業科目は、各教員が担当する回について分かるように明記してください。(この説明文は削除してください。)
回 |
内容 |
1 | コーパスとは? |
2 | 手持ちのファイルを検索する:テキストエディタ、GREP |
3 | 手持ちのファイルを処理する:正規表現による置換 |
4 | 語や品詞をカウントする:形態素解析 web茶まめとエクセルを使って |
5 | 特徴語を分析する:KH-Coder |
6 | 日本語のコロケーションを知る:NLB、NLT |
7 | 発表テーマの相談、簡易発表(1) |
8 | 発表テーマの相談、簡易発表(2) |
9 | コロケーションの指標 |
10 | 統計入門(1):仮説的統計検定の考え方 |
11 | 統計入門(2):カイ二乗検定 |
12 | 学生の発表(1) |
13 | 学生の発表(2) |
14 | 学生の発表(3) |
15 | 学生の発表(4) |
|
テキスト・参考書 |
教科書はなし。自作のプリントを配布する。参考書は授業内で指示する。 |
自学自習についての情報 |
コンピュータの操作は手続き的知識に属する。授業で習ったことを、家でもう一度「やってみる」ことは、習熟する上で必須となる。 |
授業の形式 |
コンピュータを使った実習がメインとなる。後半は演習形式で発表を行う。 |
アクティブラーニングに関する情報 |
コンピュータ操作の実習であるため、アクティブラーニング的な事は行わない。しかし、自分のデータでどうなるか、他のデータでどうなるかということを試しながら受講することは上達の近道である。 |
評価の方法(評価の配点比率と評価の要点) |
授業への参加度:30%、発表:40%、最終レポート:30% |
その他(授業アンケートのコメント含む) |
各自ノートPCを持参することが望ましい。(ない場合はIPCで借りること) |