除上书中所提到的诸多平行语料库之外,特别推荐以下平行语料库网站资源:
1. CLARIN Parallel corpora
网址:https://www.clarin.eu/resource-families/parallel-corpora
推荐理由:该网站汇总了86个平行语料库,其中47个为双语语料库,39个为多语语料库,语种十分丰富,有些多语语料库包含几十种甚至上百种语言。
2. UN Parallel Corpus
网址:https://conferences.unite.un.org/UNCORPUS/
推荐理由:联合国平行语料库,语种包括英语、法语、西班牙语、俄语、汉语和阿拉伯语。
3. European Parliament Proceedings Parallel Corpus
网址:https://statmt.org/europarl/
推荐理由:欧洲议会平行语料库,包括21种欧洲语言。
4. UM Corpus
网址:http://nlp2ct.cis.umac.mo/um-corpus/
推荐理由:英汉平行语料库,200万词,已句对齐,按照主题分类,包括教育、法律、微博、新闻、科学、口语、字母和论文几个类别。
5. E-C Parallel Concordancer
网址:https://corpus.eduhk.hk/paraconc/
推荐理由:香港教育大学建设的平行语料库在线检索平台,包含450万汉字和290万英文词,在线检索结果可下载为excel文件。
6.《红楼梦》汉英平行语料库
网址:http://corpus.usx.edu.cn/hongloumeng/
推荐理由:绍兴文理学院建设的《红楼梦》汉英平行语料库,提供在线检索功能。此外,绍兴文理学院还建设了《西游记》《京华烟云》和《毛泽东选集》的平行语料库。
7. Babel和Ted平行语料库
网址:http://114.251.154.212/cqp/
推荐理由:北京外国语大学CQPweb上提供Babel和Ted平行语料库的在线检索功能。