伊藤雅光『計量言語学入門』

国語史・日本語史周辺(日本文学・日本史・言語学などなど)の覚書です。
最善の説を記録しているものではありません。変な説も記録しています。
書誌として不完全です。
項目の形に規準はほとんどありません*
「検索」ボタンを活用して下さい。 岡島昭浩がやっております。 一部、JSPSの15H01883,18520354などの恩恵を受けております。

伊藤雅光『計量言語学入門』

伊藤雅光

初版第1刷 2002年4月1日

大修館書店

計量言語学入門

計量言語学入門




まえがき

[第1部 理論編]

第1章 計量言語学とは何か 3

 1.1 計量言語学の学問的な位置づけ 3

 1.2 計量言語学と近接分野 4

  1.2.1 計量言語学

  1.2.2 コーパス言語学

  1.2.3 数理言語学2

  1.2.4 計算言語学

 1.3 計量言語学の分野 10

  1.3.1 言語単位の使用率の研究

  1.3.2 文体の分析/

  1.3.3 言語系統研究

  1.3.4 方言区画の研究

  1.3.5社会言語学言語生活の研究

 まとめ 16

 参考文献 17

第2章 計量語彙論の基礎

 2.1 計量語彙論とは何か

  2.1.1 語彙論計量語彙論

  2.1.2 語彙の質的構造と量的構造

  2.1.3 語彙分布の種類

 2.2 計量語彙論の基本概念 23

  2.2.1 単語の数え方にかかわる基本概念―延べ語数と単位語,異なり語数と見出し

  2.2.2 単位語の集合にかかわる・基本概念―素材テクスト・単位語集合・見出し集合・使用度数

  2.2.3 見出し語の集合にかかわる基本概念―見出し語集合・語彙語彙量

  2.2.4 使用率

 まとめ 29

 参考文献 30

第3章 統計的調査法

 3.1 これまで行なわれてきた語彙用語調査 31

  3.1.1 欧米語における用語調査

  3.1.2 わが国における語彙調査

 3.2 全数調査と標本調査 35

 3.3 よい調査を行なうための五つの条件 36

 3.4 語彙調査の作業手順 38

  3.4.1 調査の企画

  3.4.2 調査対象の選定

  3.4.3標本抽出の方法

  3.4.4 どれくらいの標本を抽出すればよいか

  3.4.5単位語・見出し語の認定規則の作成

  3.4.6 本文校訂

  3.4.7 単位語の分割と見出し語別整理集計

  3.4.8 五十音順と使用率順の語彙表の作成

  3.4.9 統計解析

 まとめ 51

 参考文献 52

第4章 言語単位認定法

 4.1 言語単位の認定問題 53

 4.2 調査単位の認定

  4.2.1 文法理論にかかわる問題

  4.2.2 言語単位として自立語付属語のどちらが優先されるか

  4.2.3 単位の熟合度

  4.2.4 臨時一語の問題

  4.2.5 調査単位の長短の性格

  4.2.6 調査単位の種類が多いことの問題点

  4.2.7 本書で採用した「長い単位」について

 4.3 集計単位の認定 60

  4.3.1 単位の幅の基本問題

  4.3.2 辞書見出しの立て方と同語異語判別の関係

  4.3.3 見出し語形のゆれに関する問題

  4.3.4 可能動詞の問題

  4.3.5 ら抜きことばの問題

 4.4 欧米語の語彙表の現在の水準 64

 4.5大規模調査と語彙表の精度との関係 66

 4.6 言語単位認定の重要性 67

 まとめ 68 

 参考文献 69

第5章 見出し語情報認定法 71

 5.1 見出し語情報とは何か 71

 5.2 見出し語情報の付加作業の手順 72

 5.3 見出し語の代表形 75

  5.3.1 見出し語の代表形の基準

  5.3.2 見出し語の代表形の表記

 5.4 見出し語の正書法 75

  5.4.1 見出し語の正書法の原則

  5.4.2 送りがなの付け方が2種類ある場合

  5.4.3 標準的な表記ひらがなの場合

  5.4.4 外来語の場合

 5.5 品詞情報の認定 79

  5.5.1 どの文法学説の品詞体系を採用するか

  5.5.2 品詞情報の種類

 5.6 語種の認定 80

  5.6.1 語種とは何か

  5.6.2 語種調査における外国語の扱い方

 まとめ 81

 参考文献 82

策6章 データの整理法 83

 6.1 見出し語情報ファイルのデータ整理 83

 6.2 語彙表の作成 84

  6.2.1 語彙表の構成

  6.2.2 使用順位の決定法

  6.2.3 累積使用率分布図の作成

 6.3 使用率分布図と度数分布表と度数分布図の作成 88

 まとめ 90

 参考文献 90

第7章 統計的分析の手法 91

 7.1 基本統計量 91

  7.1.1 代表値

  7.1.2 散布度

 7.2推定 94

  7.2.1 母集団の大きさが推定できないほど膨大な量の場合

  7.2.2 母集団の大きさが推定できる量の場合

 7.3 検定 98

  7.3.1検定の原理

  7.3.2検定の手順と用語

  7.3.3 カイ二乗検定(1)―適合度の検定

  7.3.4 カイ二乗検定(2)―独立性の検定

 まとめ 111 

 参考文献 112



[第II部 実践編]

第8章 パソコン演習1 『銀河鉄道の夜』の入力と加工 115

 8.1 パソコン演習の方針 115

 8.2 素材テクストの特徴 116

 8.3 パソコン演習のための準備 117

 8.4 「銀河10」―プレイン・テキストファイルの作成 118

 8.5 「銀河20」―単位語テキストファイルの作成 121

 8.6 「銀河30」―[]付き単位語テキストファイルの作成 123

 8.7 「銀河40」―見出し語テキストファイルの作成 124

 8.8 「銀河50」―【】付き見出し語テキストファイルの作成 124

 8.9 「銀河60」―正書法付き見出し語テキストファイルの作成 125

 8.10「銀河70」―縦長データ形式へのファイル整形 126

 8.11「銀河80」―品詞付き見出し語テキストの作成 127

 まとめ 128

第9章 パソコン演習2 『蜘蛛の糸』の入力と加工 129

 9.1 「蜘蛛10」―プレイン・テキストファイルの作成 129

 9.2 「蜘蛛20」―単位語テキストファイルの作成 131

 9.3 「蜘蛛30」―[【】]付き単位語テキストファイルの作成 131

 9.4 「蜘蛛40」―縦長データ形式へのファイル整形 133

 9.5 「蜘蛛50」―見出し語テキストファイルの作成 133

 9.6 「蜘蛛60」―正書法付き見出し語テキストファイルの作成 134

 9.7 「蜘蛛70」―品詞付き見出し語テキストの作成 135

 まとめ 136

第10章 パソコン演習3  『吾輩は猫である』の入力と加工 137

 10.1 「吾輩10」―プレイン・テキストファイルの作成 137

 10.2 「吾輩20」―単位語テキストファイルの作成 138

 10.3 「吾輩30」―[【】]付き単位語テキストファイルの作成 139

 10.4 「吾輩40」―縦長データ形式へのファイル整形 142

 10.5 「吾輩50」―見出し語テキストファイルの作成 142

 10.6 「吾輩60」―正書法付き見出し語テキストの半自動作成 143

 10.7 「吾輩70」―品詞付き見出し語テキストの半自動作成 144

 まとめ 144

第11章 パソコン演習4  『最後の一句』の入力と加工       147

 11.1 「最後10」―プレイン・テキストファイルの作成 147

 11.2 「最後20」―単位語テキストファイルの作成 150

  11.2.1 「単位半自動分割」とは何か

  11.2.2 「単位半自動分割」の基本的な考え

  11.2.3 単位半自動分割の実行

  11.2.4 正しい分割と誤った分割の観察

  11.2.5 間違いの訂正

 11.3 「最後30」―[【】]付き単位語テキスト1(横長データ形式)155

 11.4 「最後40」―[【】]付き単位語テキスト2(縦長データ形式)155

 11.5 「最後50」―見出し語テキストファイルの作成 157

 11.6 「最後60」―正書法付き見出し語テキストの半自動作成 157

 11.7 「最後70」―品詞付き見出し語テキストの半自動作成 157

 まとめ 158

 参考文献 158

第12章パソコン演習5  延べ語数品詞構成比率の計算 159

 12.1 品詞構成比率の計算 159

 12.2 『銀河鉄道の夜』の品詞構成比率1  延べ語数 160

 12.3 『蜘蛛の糸』の品詞構成比率1  延べ語数 162

 12.4 『吾輩は猫である』の品詞構成比率1  延べ語数 164

 12.5 『最後の一句』の品詞構成比率1  延べ語数 164

第13章 パソコン演習6  異なり語数の品詞構成比率の計算 167

 13.1 『銀河鉄道の夜』の品詞構成比率2  異なり語数 167

 13.2 『蜘蛛の糸』の品詞構成比率2  異なり語数 !69

 13.3 『吾輩は猫である』の品詞構成比率2  異なり語数 170

 13.4 『最後の一句』の品詞構成比率2  異なり語数 170

第14章 パソコン演習7 Excelで円グラフをつくる 173

 14.1 『銀河鉄道の夜』の円グラフ作成 173

 14.2 その他のグラフの作成 177

第15章 パソコン演習8 Excelでドーナツグラフをつくる 179

 15.1 『銀河鉄道の夜』のドーナツグラフ作成 179

 15.2 その他のグラフの作成 182

第16章パソコン演習9 Exce1で自動的に語彙表をつくる1 183

 16.1 (作業の概略と語彙表の原データの作成)

 16.2 作業の概略 183

 16.3 見出し語情報の加工 185

 語彙表の原データの作成 187

第17章 パソコン演習10 Exce1で自動的に語彙表をつくる2(度数順の語彙表の作成) 191

 17.1 延べ語数の自動計算と異なり語数の読み取り法 191

 17.2 見出し語度数のパーセンテージの計算 194

 17.3 3種類の全体順位を入れる 195

 17.4 語彙表にするための整形 199

第18章 パソコン演習11 Excelで自動的に語彙表をつくる3(五十音順品詞順の語彙表作成) 201

 18.1 五十音順語彙表の作成 201

 18.2 品詞順の語彙表の作成 202

第19章 パソコン演習12 語彙表の整形 207

 19.1 度数順語彙表の整形 207

 19.2 語彙表のレポート論文への取り込み 209

 19.3 その他の語彙表の作成 209

第20章パソコン演習13 応用編(読者が選んだ小説語彙調査)   211

 20.1 選んだ小説見出し語情報付きテキストファイルの作成 211

 20.2 延べ語数品詞構成比率の計算 212

 20.3 異なり語数の品詞構成比率の計算 212

 20.4 Excelで円グラフをつくる 213

 20.5 Excelでドーナツグラフをつくる 213

 20.6 Excelで語彙表をつくる1  語彙表の原データの作成 214

 20.7 Excelで語彙表をつくる2  度数順の語彙表の作成 214

 20.8 Excelで語彙表をつくる3  五十音順品詞順の語彙表の作成 214

 20.9 語彙表の整形 215

 20.10 語彙表作成関係のファイルリスト 215



[第III部 分析編]

第21章 語彙の計量的分析1  広範囲語と高頻度語の性格 219

 21.1 語彙表の基礎的な分析 219

 21.2 広範囲語の分析 219

 21.3 広範囲語の性格 220

 21.4 少量データによる疑似的分析の意味 221

 21.5 高頻度語の性格 222

 まとめ 224

 参考文献 224

第22章 語彙の計量的分析2 延べ語数による品詞構成比率の分布法則 225

 22.1 品詞構成比率の種類 225

 22.2 品詞構成比率の傾向性の分析 225

 22.3 品詞構成比率の分布法則の発見 228

 22.4 計算練習 231

 まとめ 233

 参考文献 233

第23章 語彙の計量的分析3  異なり語数による品詞構成比率の分布法則 235

 23.1 品詞構成比率の傾向性の分析 235

 23.2 大野の法則1(原版) 237

 23.3 大野の法則2a(水谷の改訂版a)238

 23.4 近似式の計算方法 241

 23.5 近似式の計算練習 242

 23.6 大野の法則2b(水谷の改訂版b)243

 まとめ 245

 参考文献 245

第24章 語彙の計量的分析4  語彙の量的構造とは何か 247

 24.1 語彙の量的性格と語彙の量的構造 247

 24.2 語彙の量的構造の種類 248

 24.3 語彙体系の量的構造語彙運用の量的構造 249

 24.4 伝統的言語学の記述法と計量言語学の記述法 250

 24.5 数式の精密化 250

 24.6 今後も期待できる新しい品詞構成比率の分布法則の発見 251

 まとめ 252

 参考文献 253


演習・応用問題解答

7章 補説

索引

書籍からの画像で注記のないものは、著作権法上の「引用」の範囲内であるか、著者の著作権が切れて刊行後五十年以上経っているものである筈です。