科目情報
科目名 国語学特論II 
クラス − 
授業の概要 コーパスと呼ばれる、実際に使用された言語データをもとに、日本語の特性について様々な角度から分析を行う。大量のテキストデータから、統計的な技法を駆使して価値あるデータを取り出すテキストマイニングの手法を身に着ける。 
授業の到達目標 コンピュータを使って日本語を分析することを通して、コンピュータの操作に習熟し、GREP、Excel、仮説的統計検定の技法を身に着ける。  
授業計画
内容
1コーパスとは? 
2手持ちのファイルを検索する:テキストエディタ、GREP 
3手持ちのファイルを処理する:正規表現による置換 
4語や品詞をカウントする:形態素解析 web茶まめとエクセルを使って 
5特徴語を分析する:KH-Coder 
6日本語のコロケーションを知る:NLB、NLT 
7発表テーマの相談、簡易発表(1) 
8発表テーマの相談、簡易発表(2) 
9コロケーションの指標 
10統計入門(1):仮説的統計検定の考え方  
11統計入門(2):カイ二乗検定  
12学生の発表(1) 
13学生の発表(2) 
14学生の発表(3) 
15学生の発表(4) 
 
テキスト・参考書 教科書はなし。自作のプリントを配布する。参考書は授業内で指示する。  
自学自習についての情報 コンピュータの操作は手続き的知識に属する。授業で習ったことを、家でもう一度「やってみる」ことは、習熟する上で必須となる。  
授業の形式 コンピュータを使った実習がメインとなる。後半は演習形式で発表を行う。 
アクティブラーニングに関する情報 コンピュータ操作の実習であるため、アクティブラーニング的な事は行わない。しかし、自分のデータでどうなるか、他のデータでどうなるかということを試しながら受講することは上達の近道である。  
評価の方法(評価の配点比率と評価の要点) 授業への参加度:30%、発表:40%、最終レポート:30%  
その他(授業アンケートへのコメント含む) 各自ノートPCを持参すること。(ない場合はIPCで借りること) 
担当講師についての情報(実務経験) 授業担当者はコーパス分析とその教育への応用を研究のメインテーマとしており、教材や参考書も多数作成している。