科目情報
科目名 国語学特論II 
クラス − 
授業の概要 コーパスと呼ばれる、実際に使用された言語データをもとに、日本語の特性について様々な角度から分析を行う。大量のテキストデータから、統計的な技法を駆使して価値あるデータを取り出すテキストマイニングの手法を身に着ける。 
授業の到達目標 コンピュータを使って日本語を分析することを通して、コンピュータの操作に習熟し、GREP、Excel、仮説的統計検定の技法を身につける 
授業計画
内容
1コーパスとは? 
2手持ちのファイルを検索する:
テキストファイルの処理方法、GREP 
3手持ちのファイルを置換する:
正規表現、少納言の体験 
4語数や品詞をカウントする:
形態素解析 j-Readabilityを用いて 
5特徴語を分析する:
テキストマイニング入門 KH-Coderを用いて 
6日本語のコロケーションを知る:
NLB、NLTの利用 
7発表のテーマの相談、簡易発表(1) 
8発表のテーマの相談、簡易発表(2) 
9コロケーション分析に役立つ指標 
10統計入門、カイ二乗検定 
11学生のテーマによる発表(1) 
12学生のテーマによる発表(2) 
13学生のテーマによる発表(3) 
14学生のテーマによる発表(4) 
15レポート・論文を書くうえで気をつけるべきこと 
 
テキスト・参考書 自作のテキストを適宜配布する。 
自学自習についての情報 コンピュータの操作は手続き的知識に属する。授業で習ったことを、家でもう一度「やってみる」ことは、習熟する上で必須となる。
復習を必ず行うこと。適宜課題も課す。 
授業の形式 コンピュータを使った実習がメインとなる。後半は演習形式で発表を行う。 
評価の方法(評価の配点比率と評価の要点) 授業への参加度:30%、発表:40%、最終レポート:30% 
その他(授業アンケートのコメント含む) 各自ノートPCを持参することが望ましい。(ない場合はIPCで借りること)