Lesson3 语料库的基本概念
1.文本
2.标注
元信息标注
词性赋码
3.词、形符、类符、类符/形符比
形符:文本中任何一个独立的单词
类符:文本中任何一个独特的词形
类形符比 TTR
标准类形符比 STTR
4.频数、频率
5.搭配、类联接
搭配:词与词之间的关系
类联接:词在语法之间的关系
6.多词序列、语义韵
Lesson3 语料库的基本概念
1.文本
2.标注
元信息标注
词性赋码
3.词、形符、类符、类符/形符比
形符:文本中任何一个独立的单词
类符:文本中任何一个独特的词形
类形符比 TTR
标准类形符比 STTR
4.频数、频率
5.搭配、类联接
搭配:词与词之间的关系
类联接:词在语法之间的关系
6.多词序列、语义韵
Lesson2 语料库的应用
1.语料库与词典编纂
COBUILD语料库
朗文字典:唯一释义词汇不超过2000的字典
学习者词典:收词广泛 与时俱进
2.语料库与教材编写
3.语料库与大纲制定
4.语料库与语言测试
5.语料库与教学研究
Sketch engine搜索引擎
语义韵 filter concordance
同义词 Thesaurus
词概差异 word sketch differences
Lesson1
语料库:大规模电子文本集合/大规模电子文本库
分类:
通用语料库:大而全
专用语料库:只收集某特定领域的语料库样本
BNC 英国国家语料库
COCA美国当代英语语料库
BROWN-LOB
口语/笔语语料库
共时/历时语料库
本族语者/学习者语料库
单语/双语/多语语料库