问题编号:19671   浏览人次:159   回答:1   顶:0   踩:0
收藏 分享链接:
解答状态:待完善    评论状态: 可以

1582554162@qq.com向李亮提问 (2018-05-08提问)

李老师,您好!我想查询一个语料库句法结构是NP1 NP2 的所有例句,如“今天阴天”。已经尝试过用国家语委语料库的连续词类串 /n /n 查询,但数量很多,其中绝大部分是复合词。并且没有涵盖如“他老师北京人、杨过一只手”等其他子结构类型的例句。请问您知道有什么方法或其他现代汉语语料库能够查到这种抽象句法格式的例句吗?谢谢。

uliliang 2018-06-13

你的问题是一个看上去很简单,其实稍微一细想就发现是个超级复杂的难题。你要的NP表面上可以是一个名词,但其实你需要的是一个名词做主语且缺乏动词且名词做宾语的情况,你想想,没有句法标注器的标注的支持,你怎能找到这种极其罕见的结构,连你自己也抱怨“名词+名词”几乎都是复合名词。换个角度说,你要的其实是只有两个名词所构成的句子,所以你可以提取所有的汉字数量在10个之内的汉语句子然后再词类标注之后看看是否由两个名词组成,然后再看看是否是主语宾语的结构。当然,更复杂情况是,你要的现象竟然嵌套在长句,那这种情况就更复杂了,简直没法用简单方法进行提取了。我估计你不会正则式,你其实应该学一学。我估计你其实没法拿到在线语料库的全套语料到本地,你其实应该自己建库而方便句法标注。我估计你其实不关心你要的结构有多冷僻或多少的出现概率,估计你只是想要研究“那种结构的认知机制”,所以你建库更方便。详情可加我微信liliang_1975进一步交流。
现有0条回复     顶:0   踩:0