科目名 |
国語学特論II |
クラス |
− |
授業の概要 |
コーパスと呼ばれる、実際に使用された言語データをもとに、日本語の特性について様々な角度から分析を行う。大量のテキストデータから、統計的な技法を駆使して価値あるデータを取り出すテキストマイニングの手法を身に着ける。 |
授業の到達目標 |
コンピュータを使って日本語を分析することを通して、コンピュータの操作に習熟し、GREP、Excel、仮説的統計検定の技法を身につける |
授業計画 |
回 |
内容 |
1 | コーパスとは? |
2 | 手持ちのファイルを検索する: テキストファイルの処理方法、GREP |
3 | 手持ちのファイルを置換する: 正規表現、少納言の体験 |
4 | 語数や品詞をカウントする: 形態素解析 j-Readabilityを用いて |
5 | 特徴語を分析する: テキストマイニング入門 KH-Coderを用いて |
6 | 日本語のコロケーションを知る: NLB、NLTの利用 |
7 | 発表のテーマの相談、簡易発表(1) |
8 | 発表のテーマの相談、簡易発表(2) |
9 | コロケーション分析に役立つ指標 |
10 | 統計入門、カイ二乗検定 |
11 | 学生のテーマによる発表(1) |
12 | 学生のテーマによる発表(2) |
13 | 学生のテーマによる発表(3) |
14 | 学生のテーマによる発表(4) |
15 | レポート・論文を書くうえで気をつけるべきこと |
|
テキスト・参考書 |
自作のテキストを適宜配布する。 |
自学自習についての情報 |
コンピュータの操作は手続き的知識に属する。授業で習ったことを、家でもう一度「やってみる」ことは、習熟する上で必須となる。 復習を必ず行うこと。適宜課題も課す。 |
授業の形式 |
コンピュータを使った実習がメインとなる。後半は演習形式で発表を行う。 |
評価の方法(評価の配点比率と評価の要点) |
授業への参加度:30%、発表:40%、最終レポート:30% |
その他(授業アンケートのコメント含む) |
各自ノートPCを持参することが望ましい。(ない場合はIPCで借りること) |