问题编号:18526   浏览人次:472   回答:3   顶:0   踩:0
收藏 分享链接:
解答状态:待完善    评论状态: 可以

13948614616向李亮提问 (2017-04-18提问)

李老师,您好: 我想尝试一下量化的研究,如果想从一个文本中提取所有的人称代词,分类别的人称代词,比如,你,我, 她,以及人称代词的搭配,比如, 我们自己,我们中国人,他们美国人 等,有什么养的软件可以完成这样分类提取的任务吗? 这个网站上的pancount 可以吗?我从iresearch网站上下载了,但是会用,看了一下说明,但是按照说明点击file 里的new时,没有任何反应, 初学者,还请多多指教, 谢谢!

uliliang 2017-05-03

你的需求只需要简单的正则式就能解决的,patcount就是一个正则式语料工具,当然可以满足你的需求。你所称的“提取”恐怕只是计数,并非提取出每处代词左右的语境词,你就算不用正则式也能直接用antconc来快速拿到每个具体代词的出现次数,毕竟中文代词的数量很少,很容易进行简单累加,只是你用正则式就能一次表达式就不用输入代词本身而是输入代词在语料中实际所附带的代词标签而提取代词或统计代词数量。我做过两份AntConc的模糊检索的图文教程,欢迎你读读。
《AntConc的语料神技:模糊匹配》http://jingyan.baidu.com/article/25648fc185f8a89190fd004b.html
《语料检索的速成教程:已经词性赋码语料的检索》
http://www.doc88.com/p-701929069023.html
在线中文词类标注且自动分词工具(不限容量、速度奇快) http://www.xunsearch.com/scws/demo/v48.php
在线正则式工具(不限容量,速度奇快) http://tools.dedecms.com/regex.html#
现有1条回复     顶:1   踩:0
huck: (2017-05-04 08:44)
谢谢李博士的倾囊相授,受益无穷。

uliliang 2017-05-04

《李亮版动画教程:批量提取汉语语料的动词》https://user.qzone.qq.com/492130980/blog/1449453912
《李亮版动画教程:批量提取英语中的形容词》https://user.qzone.qq.com/492130980/blog/1449422984
现有0条回复     顶:1   踩:0

huck 2017-05-04

谢谢李博士的倾囊相授,受益无穷。
现有0条回复     顶:0   踩:0