科目情報
科目名 国語学特論I 
クラス − 
授業の概要 コーパスと呼ばれる、実際に使用された言語データをもとに、日本語の特性について様々な角度から分析を行う。大量のテキストデータから、統計的な技法を駆使して価値あるデータを取り出すテキストマイニングの手法を身につける。なお、参加者の興味・関心に応じて、授業で扱うツールや素材、技法は変更する。 
授業の到達目標 コンピュータを使って日本語を分析することを通して、コンピュータの操作に習熟し、GREP、Excel、仮説的統計検定の技法を身につける 
授業計画
内容
1コーパスとは? 
2手持ちのファイルを検索する:
テキストファイルの処理方法、GREP 
3手持ちのファイルを置換する:
正規表現、少納言の体験 
4語数や品詞をカウントする:
形態素解析 j-Readabilityを用いて 
5特徴語を分析する:
テキストマイニング入門 KH-Coderを用いて 
6日本語のコロケーションを知る:
NLB、NLTの利用 
7日本語のコロストラクションを探る:
中納言の活用 
8発表のテーマの相談、簡易発表(1) 
9発表のテーマの相談、簡易発表(2) 
10コロケーション・コロストラクション研究に役立つ指標 
11仮説的統計検定の基礎 
12χ二乗検定の実践 
13学生のテーマによる発表(1) 
14学生のテーマによる発表(2) 
15レポート・論文を書くうえで気をつけるべきこと 
 
テキスト・参考書 自作のテキストを適宜配布する。 
自学自習についての情報 コンピュータの操作は手続き的知識に属する。授業で習ったことを、家でもう一度「やってみる」ことは、習熟する上で必須となる。
復習を必ず行うこと。適宜課題も課す。 
授業の形式 コンピュータを使った実習がメインとなる。後半は演習形式で発表を行う。 
アクティブラーニングに関する情報 教員が呈示するのはあくまでも研究の「方法」のみです。後半は参加者が各自データを持ち寄り、自分の興味に合わせて分析をします。 
評価の方法(評価の配点比率と評価の要点) 授業への参加度:30%、発表:40%、最終レポート:30% 
その他(授業アンケートのコメント含む) 各自ノートPCを持参することが望ましい。(ない場合はIPCで借りること)