(0人评价)
语料库在基础英语教学及研究中的应用
价格 免费

Lesson4 语料库软件基本操作

一、检索相关功能

1.concordance词汇索引

raw 生文本

pos词性赋码后的文本

举例1:

is  (左下角显示出现的频数)

is|was   (|表达“或”的意思;右下角statistics可以查看具体分布)

@be (检索be动词所有形式)

举例2: (*用以匹配任意一个单词)

a * day

at the * of

举例3:(词性码)

JJ  (形容词)

NN1  (单数名词)

JJ NN1  (检索形容词修饰单数名词的情况)

举例4: (#放在磁性类别码之前,匹配该词性大类对应的各词性码子类, 如 #n匹配所有的名词)

#n  (Reduce Pos--- sys--Reduce_POS_CLAWS7)

#adv important  (检索有哪些副词会用来修饰important)

#adv different

举例5:(混合表达式)

@be VVN (检索be动词加过去分词的情况)

@be #adv VVN (检索被动语态中间加副词的情况)

it @be #adj that  (检索it作形式主语的情况)

举例6:(检索框上面的case是区分大小写功能)

选中case 输入However (检索大写However也即用于句首的情况)

选中case 输入however (检索however在句中的使用情况)

举例7: (批量检索--检索框上的 Batch Search)

新建一个txt文档--输入要批量检索的所有词汇--在检索框中选中Batch Search--点击load list选中txt文档--点击search

小结:

练习题:

检索下列语言形式:

  • 1. have或has  (have | has)
  • 2. make的所有屈折形式 (@make)
  • 3. a +任意词+of (a * of)
  • 4.形容词修饰hair (#adj hair)
  • 5.完成时 (@have VVN)
  • 6.Though/though区分大小写(勾选case)
[展开全文]

Lesson3 语料库的基本概念

1.文本

2.标注

元信息标注

词性赋码

3.词、形符、类符、类符/形符比

形符:文本中任何一个独立的单词

类符:文本中任何一个独特的词形 

类形符比 TTR

标准类形符比 STTR

4.频数、频率

5.搭配、类联接

搭配:词与词之间的关系

类联接:词在语法之间的关系

6.多词序列、语义韵

 

[展开全文]

Lesson2 语料库的应用

1.语料库与词典编纂

COBUILD语料库

朗文字典:唯一释义词汇不超过2000的字典

学习者词典:收词广泛 与时俱进

  • 语料库为选词立目提供客观依据
  • 语料库提高词典释义的完备性和准确度
  • 语料库为词典提供真实而具有代表性的例证
  • 语料库为词典更新与修订提供保障

2.语料库与教材编写

  • 语料库是教材的语料源泉
  • 语料库上检验教材的手段
  • 基于词频的教材词汇广度分析
  • 基于语义频数的教材词汇深度

3.语料库与大纲制定

  • 语料库与核心词汇(基本词汇)(最常见的700词可以覆盖70%的文本;最常见的1500词可以覆盖76%的文本;最常见的2500词可以覆盖80%的文本。)
  • 尽可能提高核心词汇的覆盖率
  • 严格控制课文长度和生词数量
  • 提高生词的复现率
  • 对常用词语搭配的选择的重视

4.语料库与语言测试

  • 从语料库中获得一些常用的词汇、短语、句子、语法结构等进行测试
  • 语料库有可能提升语言能力水平测试中的透明性、连续性和可比较性
  • 进行评分量表的制定和试题编制
  • 借助语料库进行语言测试效度的验证

5.语料库与教学研究

  • 借助在线语料库搜索引擎,进行词汇教学
  • 创建微本语料库,进行词汇教学、阅读、写作教学
  • 创建小型学习者语料库,进行学生写作共性错误研究

 

Sketch engine搜索引擎

语义韵 filter concordance

同义词 Thesaurus

词概差异 word sketch differences

 

 

[展开全文]

Lesson1

语料库:大规模电子文本集合/大规模电子文本库

 

分类:

通用语料库:大而全

专用语料库:只收集某特定领域的语料库样本

BNC 英国国家语料库

COCA美国当代英语语料库

BROWN-LOB

口语/笔语语料库

共时/历时语料库

本族语者/学习者语料库

单语/双语/多语语料库

 

 

 

[展开全文]