1.1 定义
A collection of texts stored in an electronic database.
1.2 类型 5种
通用/专用语料库
笔语/口语语料库
公时/历时语料库
本族语者/学习者语料库(机读学习者语料库)
“中国英语学习者口笔语语料库”
单语/双语/多语yu liao ku
1.1 定义
A collection of texts stored in an electronic database.
1.2 类型 5种
通用/专用语料库
笔语/口语语料库
公时/历时语料库
本族语者/学习者语料库(机读学习者语料库)
“中国英语学习者口笔语语料库”
单语/双语/多语yu liao ku
大规模电子文本
语料库
~。
i话料库
定义:按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建立的具有一定容量的大型电子文库。
类型:
通用语料库:大而全,代表一种语言的全貌
(BNC,COCA,BROWN- LOB,CROWN-CLOB)
专用语料库:特性领域的语料库样本
笔语语料库:书面语形式(报刊,书籍,论文等)
口语语料库:口语转写的文本合集,有时也包括语音文本
共时语料库:同一时代的语言使用者样本(横向)
历史语料库:不同时代的语言使用者样本(纵向)
本族语者语料库:本族语者(作为大型参照)
学习者语料库:非本族语学习者(CLEC,SWECCL)
单语语料库:同一种语言
双语语料库:两种语言(多用于翻译)
语料库——大规模电子文本库
通用语料库:BNC(英国) COCA(美国)
笔语语料库/口语语料库
共时语料库(横向)/历时语料库(纵向)
本族语者语料库/学习者语料库——CLEC、SWECCL
单语语料库/双语/多语语料库
通用语料库:大而全
专业:新闻、教学
一、语料库及其基本概念介绍
1.1定义:大规模电子文本集合
1.2主要类型
1.2.1通用/专用语料库
general corpus:最好的代表一种语言的全貌建成的语料库。
通用语料库举例:BNC英国国家语料库/COCA美国当代英语语料库
specialized corpus:只收集某特定领域的语料库样本
1.2.2笔语、口语语料库
written corpus:书面语。书籍报刊书信学术论文
spoken corpus:口语,包括语音文本
1.2.3共时/历时语料库
synchronic corpus:同时代
diachronic corpus:不同时代
1.2.4本族语者/学习者语料库
native speaker's corpus
learner's corpus(e.g. CLEC《中国学习者英语语料库》)
1.2.5单语/双语/多语语料库
monolingual corpus
parallel/biligual corpus
常见语料库软件操作
小型教学语料库创建
语料库的教学应用
语料库与教学研究
Lesson1
语料库:大规模电子文本集合/大规模电子文本库
分类:
通用语料库:大而全
专用语料库:只收集某特定领域的语料库样本
BNC 英国国家语料库
COCA美国当代英语语料库
BROWN-LOB
口语/笔语语料库
共时/历时语料库
本族语者/学习者语料库
单语/双语/多语语料库