词频
- 语言产生中词频效应老化的神经基础与时间进程*
宣 宾语言产生中词频效应老化的神经基础与时间进程*章丽娜 宣 宾(安徽师范大学教育科学学院, 芜湖 241000)词频效应指语言产生中人们对高频词汇的加工比低频词汇更快更准确的一种现象, 它可能发生在语言产生中的不同阶段。对青年人和老年人词频效应的不同特点和加工机制进行比较, 可以考察语言产生的认知老化机制。通过语言产生理论可对词频效应的老化进行预测, 提出词频效应在个体发展和老化阶段的相对稳定性, 分析老化导致词频效应相关的神经基础和加工时间进程的改变。
心理科学进展 2022年2期2022-02-18
- 基于词频比的改进Jaccard系数文本相似度计算
学院 谢 红基于词频比的改进Jaccard系数文本相似度计算,交集中词的权重不是相同的,而是按照词频比确定权重。通过短文本实验和长文本实验,基于词频比的改进Jaccard相似度比传统Jaccard相似度更加科学合理,适合法律法规、政策文件等说明性文本的相似度计算。1 引言文本相似度计算是指通过一定的策略比较两个或多个实体(包括词语、短文本、文档)之间的相似程度,得到一个具体量化的相似度数值[1]。相似度数值用[0,1]闭区间的实数表示,数值越大,文本相似度
内江科技 2021年8期2021-09-13
- 音形关系在自然拼读教学法中的应用研究
形对应关系可以在词频高低上得到直观地体现。一般来说,词频比例越高,音形关系就越稳定。由此可以总结出一些具有教学意义的音形规律,如元音字母在开音节与闭音节中的音形关系,r音节的音形规律。运用自然拼读教学法实施英语教学的过程中,研究结果将对教学顺序、重点难点等问题产生一些启示。[关键词] 自然拼读教学法;音形关系;词频一、研究背景长久以来,英语学习者在面对杂乱无章的字母组合时,常常感到束手无策,既不能准确地读出单词,也无法顺利地拼写出来。而拼读能力的不足又直接
启迪·上 2021年4期2021-09-10
- 特征加权的CLSVSM
念之间的关系,对词频进行类别概念信息加权,最终构建了文本向量;唐明伟等[9]提出了基于领域本体的语义向量空间模型,大大地提高了文本检索效率;Mikolov等[10]提出了Continuous Bag-of-Words Model和Continuous Skip-gram Model,用于学习词的分布表示以减小计算复杂度,使用更多的数据集和高维度的词向量会有更高的准确率,但是同时也耗费更多的时间,分布语义模型[11]被广泛运用;牛奉高等[12]提出了共现潜在
计算机与现代化 2021年5期2021-05-27
- 国内数学史与数学教育研究的热点与趋势
——基于CiteSpace的知识图谱分析
析法对关键词进行词频统计、中心性比较、突变词与聚类分析,以揭示不同HPM研究之间的耦合关系,有助于凝炼国内HPM研究中的热点领域.绘制出我国HPM研究关键词的共现网络图谱,如图4所示.图4 我国HPM研究关键词的共现网络图谱从共现频次来看,由表1可知,在关键词词频排名前15的关键词中,“数学史”以928次位居首位.从中心性来看,“数学文化”“数学史”“HPM”“数学教育”“高中数学”“数学教学”“数学素养”以及“教学设计”的中介中心性均大于0.1且高于其他
内江师范学院学报 2021年4期2021-05-06
- 术语表研制的四个步骤
要:在国外学者的词频研究方法、语境研究方法和语料对比方法的基础上,以英语语言学56万余字的语料为基础,提出了四个步骤的术语表研制方法,并且归纳出了359个英语语言学术语。这种研究不仅是对英语语言学术语的第一次尝试性归纳,而且研究方法上的创新可以应用于其他学科的术语研究和术语表的研制。关键词:术语表;英语语言学;词频;语境;语料库中图分类法: N04;H083文献标识码:ADOI:10.3969/j.issn.1673-8578.2021.02.002A F
中国科技术语 2021年2期2021-04-22
- 大数据中的丝绸文化情感探析
大数据,对情感词词频的统计展示了丝绸文化正、负情感在“一带一路”倡议影响下的总体走向;对历年丝绸文化情感来源的构成分析,发现了物质性来源的下降趋势、社会性和精神性来源的上升趋势,揭示了“一带一路”影响下丝绸文化主导形态的转变和升级。研究结果表明,对于新时期丝绸文化发展状态的评估、文化政策制定具有重要参考价值。关键词: 丝绸;情感;大数据;文化计算;“一带一路”倡议;词频Abstract: Around the digital observation of
丝绸 2021年3期2021-03-28
- 农民工工资支付现状网络爬虫数据分析
据进行抓取并通过词频分析绘制词云图了解《保障农民工工资支付条例》(以下简称《条例》)施行后对于工资支付现状的改善程度,并在此基础之上结合具体结论为《条例》的进一步落实和推广提供建议。关键词:条例;网络爬虫;词频;农民工;工资支付1.1.1 全国各省份拖欠情况分析为推动党中央、国务院根治欠薪重大决策部署贯彻落实,便捷高效回应群众关切,人力资源社会保障部日前在门户网站开通“根治欠薪进行时”专栏。为获取更多真实有效的数据,了解全国恶意欠薪情况,本团队对此专栏的“
科学与财富 2021年4期2021-03-08
- 新时期丝绸文化演变的大数据解读
征体系,结合特征词频率统计方法,考察丝绸文化的特征分布及其新时代内涵;通过在时间轴上跟踪文化特征分布的变化,揭示丝绸文化演进的失衡区间和“三分段”模式,并分析失衡区间中的拐点现象及其成因。通过将大数据采集和计量方法与传统文化特征体系无缝衔接,研究以数理实证方式展示了丝绸文化的内涵升级和结构重组,有助于深入理解“一带一路”影响下传统文化的现实状态和发展方向。关键词: 丝绸;一带一路;文化计算;文化特征;特征词;词频中图分类号: TS101.1;G202 文献
丝绸 2020年12期2020-12-28
- 基于互联网的陶瓷产品网购行为偏好分析
情感分布、偏好。词频分析中外观类的词频最高,所占比例为43.3%。说明顾客对陶瓷的艺术性、观赏性、装饰性考虑的比较多。这也符合现代社会人们追求个性的特点。研究表明,质量、包装两个词汇的紧密程度最高,陶瓷具有易碎,体积大、不易搬运等特性,所以许多顾客会担忧商品会有破损、瑕疵等问题。建议陶瓷生产企业注重好的创意,在商品的外观上满足顾客个性化需求。在包装上要考虑坚固性、密封性。在质量上提升产品的耐用度和做工精细度。关键词:陶瓷产品;评价内容;数据挖掘;词频中图分
电脑知识与技术 2020年28期2020-12-14
- 基于Word的中文词频分析系统设计与实现
】word分词;词频;中文分词【中图分类号】TP311.52 【文献标识码】A 【文章编号】1674-0688(2020)10-0070-030 引言中文分词处理需要对现有的中文信息至少从字、词、句等3个层面进行处理,甚至必须从语义、词性等方面处理才能分析出其中意义。在中文里面,词是最小的语言单位,如果不处理好中文分词的问题,那么处理语句问题也就无从谈起,所以中文分词是中文处理技术的基础。相对于其他语言,中文分词是比较复杂的。英语的单词之间有着空格相隔,检
企业科技与发展 2020年10期2020-12-09
- 藏语阅读中词长、词频对注视时间和注视位置的影响
【摘要】 词长、词频是影响阅读过程中眼动控制的两个最为重要的因素,然而这种影响在不同语言文字系统中的表现还存在着争议。本文将从注视时间和注视位置这两个方面全面梳理拼音文字和表意文字中词长、词频影响眼动控制的研究成果,以期为未来藏语中的相关研究提供借鉴和参考。【关键词】 词长;词频;注视时间;注视位置;眼动【中图分类号】G442 【文献标识码】A 【文章编号】2096-8264(2020)14-0053-03基金项目:本研
今古文创 2020年14期2020-09-10
- 小语种复合人才培养目标下数据挖掘在创新日语口译词汇教学模式中的应用
主要从词汇总量、词频、搭配、双语文本数据对比四个方面,论述数据挖掘对词汇教学创新模式有一定的辅助作用。关键词 日语口译 词汇教学 词频Abstract Based on data mining, this paper discusses the application of the results of text statistics in vocabulary teaching of Japanese interpretation course. Thi
科教导刊 2020年4期2020-05-08
- 基于Bi-LSTM和TFIDF的工单事件提取
络;条件随机场;词频-逆文件频率算法;电网工单;事件抽取中图分类号:TP183 文献标识码:A文章编号:1009-3044(2020)04-0291-03收稿日期:2019-10-15作者简介:范华(1971—),男,浙江杭州人,浙江中新电力工程建设有限公司,高级工程师,硕士,配网自动化;翁利国(1982—),男,浙江杭州人,国网浙江杭州市萧山区供电有限公司,高级工程师,硕士,配网自动化。Event Extraction of Power Customer
电脑知识与技术 2020年4期2020-04-14
- 农民工工资支付现状网络爬虫数据分析
据进行抓取并通过词频分析绘制词云图了解《保障农民工工资支付条例》(以下简称《条例》)施行后对于工资支付现状的改善程度,并在此基础之上结合具体结论为《条例》的进一步落实和推广提供建议。关键词:条例;网络爬虫;词频;农民工;工资支付1.1.1 全国各省份拖欠情况分析为推动党中央、国务院根治欠薪重大决策部署贯彻落实,便捷高效回应群众关切,人力资源社会保障部日前在门户网站开通“根治欠薪进行时”专栏。为获取更多真实有效的数据,了解全国恶意欠薪情况,本团队对此专栏的“
科学与财富 2020年34期2020-03-11
- 基于诗词景观意象特征下的宜春台朝向研究
宜春台的诗词进行词频统计分析:①未发现与“春台晓日”相关词汇;②包含大量感伤意向词汇。根据词汇特征,从宜春地区日出方位与山水环境等角度对宜春台坐南朝北的空间格局做进一步分析,得出“春台晓日”与宜春台朝向及在城市中的空间分布、周边山水环境有着密切联系;而通过风环境分析得出宜春台朝向加剧古人登临生悲的情感抒发。关键词:建筑朝向;诗词;词频;景观意向台是一个特殊的景观建筑类别,众多服务于统治阶级的景观建筑都建于高台之上,宜春台亦是如此。宜春台始建汉代,是宜春地区
现代园艺·综合版 2020年1期2020-03-08
- 基于COCA语料库的近义词辨析
库;近义词辨析;词频;搭配一、引言近义词,是指词汇意义相同或相近但在用法上有所不同的词语。在英语语言中,近义词占据着很大的比例,它们通过词义和用法等方面的相同或相近构成了庞大复杂的英语词汇体系。近义词的辨析一直是英语学习的重难点,因为缺少英语国家的文化背景,英语学习者难以在脱离语境的情况下把握词汇之间的区别。传统的近义词辨析通常依赖于词目意义的逐条分析,借助直觉经验和内省的定性方法,但是词典释义的方法有很大的局限性,因为它仅能提供几个义项和几个简单的句子进
青年时代 2019年32期2019-12-24
- NSFC 计算机图像与视频处理领域项目关键词分析*
请书进行关键词的词频和趋势规律分析,有助于揭示本领域研究的热点、总体内容特征、内容之间的内在联系、学术研究的发展脉络与发展方向等[1].文献[2]对国家自然科学基金自动化领域1986 年~2017 年项目申请和资助数据进行了大量分析,发现自动化领域基金资助的相关领域反映了国内外研究前沿;同时发现,热点领域理论研究的比重大于应用基础研究.近些年,随着网络和存储技术的快速发展,多媒体数据量呈爆炸式增长,图像和视频数据的研究已成为计算机应用领域研究的热点.201
软件学报 2019年9期2019-10-24
- 汉语图画命名过程的年老化机制:非选择性抑制能力的影响*
词汇产生中的干扰词频效应, 以及非选择性抑制能力对两组人群干扰词频效应和图画命名潜伏期的影响。结果发现:无关干扰词的词频影响了青年人的图画命名过程, 出现了干扰词频效应, 这一效应更可能发生在反应排除阶段, 且不受非选择性抑制能力的影响; 相比而言, 老年人中未出现干扰词频效应, 这可能是由于老年人的音韵表征衰退导致其不能利用干扰词的词频信息, 支持了口语产生认知年老化的传输不足假设。非选择性抑制能力影响了老年人的图画−词汇干扰任务中图画命名的潜伏期, 非
心理学报 2019年10期2019-10-17
- 基于语料库的独立学院学生英语写作词汇丰富性特征研究
度;词汇复杂性;词频【作者简介】殷铭(1982-),男,江苏泰州人,南京师范大学泰州学院外国语学院,硕士,研究方向:二语习得和语料库研究。一、引言作为一项重要的语言输出综合技能,写作一直是英语教学界研究的重点。在《大学英语教学指南》中对写作也提出更高的要求,不但“能用英语进行日常的沟通与交流,还要能有效地进行中华文化的传播”,这需要学生除掌握写作必备的词汇和语法结构等“外壳”外,还要具备较强的逻辑组织和思辨能力的“内核”。但是纵观独立学院大学英语现状,很多
校园英语·下旬 2019年7期2019-10-07
- 体育英语词频数据库的构建
如何构建体育英语词频数据库,总结出体育英语词汇的出现场合,区分出体育英语高频词汇和低频词汇迫在眉睫。本文简述了构建体育英语词频数据库的若干策略。关键词 体育英语 词频 数据库一、概述体育运动及赛事的目的之一就是使人们之间的沟通更容易,合作更广泛。在全球化高速发展,国际赛事日渐增多的今天,语言交流成为了人们参赛和观赛的基本保障。英语作为一门国际通用语言无时无刻不存在于体育赛事之中,不仅影响着不同母语的运动参与者之间的沟通和交流,而且也会影响体育爱好者观赏体育
科海故事博览·下旬刊 2019年2期2019-09-10
- 中国普通高校校训词频研究
神的重要体现。以词频统计的方式对我国高校的校训进行研究,分析我国校训的来源、内容、形式方面的特点,发现我国校训在扎根传统经典的土壤、全面示范的同时,存在缺乏特色、趋同现象严重等问题。因此,我国高校校训要结合自身办学历史传统,更加突出个性化特色,使校训更好地发挥评价、引导、激励作用。关键词:普通高校;校训;词频;趋同《说文解字》对“训”的解释是“训,说教也”,可见,“训”有表示用规范来进行说教、教导之义。因此,校训成为一个学校办学理念、校风精神的集中表现,既
现代语文 2019年5期2019-08-09
- 基于共现和关联挖掘的人物关系图构建过程
词来提取关键词的词频。两个关键词在同一段中出现的次数越多,它们之间的联系越密切,与反映的主题内容越密切。通过给出的关键词挖掘出频繁项集,然后发现它们之间存在的关联规则。关键词:共现分析;词频;频繁项集;关联规则1 研究现状1.1 国外研究现状共现分析在国外已经相当成熟了,最初是由法国文献计量学家提出来的[1],发展至今差不多有50年了。起初主要应用于文献计量、图书情报学等领域,随着共现分析的发展成熟,20世纪90年代,共现分析应用的范围越来越细化,参与的学
无线互联科技 2019年1期2019-05-24
- 词汇习得中的词频效应研究
自然阅读过程中,词频是促进词汇附带习得的重要客观因素,与词频相关的词频效应则是词汇习得与理解过程中极其常见的心理现象。因此,对于词频效应的研究能够极大地推进二语词汇习得和神经认知学研究的深入,可以展现词汇习得的神经心理机制。一、词频效应的不同理论解释词频在单词认知过程中是一个重要的变量,低频词要经由语音的中介,也就是将文字转为语音后进行加工,但是高频词则通过视觉表征直接抵达心理词典的词条。Gough等人认为,高频词的认知时间短在于高频词认知过程的程序少,所
亚太教育 2018年5期2018-12-01
- 重复阅读中的词频效应研究
的行为常有发生。词频效应是指在阅读的过程中对词汇的注视时间会随着词频的不同而不同的表现,比起高频词来说,阅读者对低频词的注视时间会更长。二、词频效应影响阅读的相关研究词频指词语的出现频率。高频词就是出现次数较多或者经常遇到的词语,低频词就是出现次数较少或者不经常遇到的词语。在以往的研究中,词频效应主要被广泛运用在词汇识别领域中,并通过使用不同的研究方法和实验范式(词汇命名任务、词汇识别、语义分类任务等)取得较多有意义的成果。Monsell、Forster和
亚太教育 2018年5期2018-12-01
- 中药安全研究的知识图谱与主题分析
研究。方法:运用词频分析法,借助SATI 3.2软件和Ucinet 6软件,统计研究文献中与中药安全、质量及风险相关的关键词或主题词出现的频次。对高频关键词作共现分析,并以共现矩阵为基础绘制高频关键词的可视化网络图谱;从网络密度、集聚度、小世界效应3个方面进行关键词网络整体特征分析,从节点中心性、中间中心性和接近中心性3个方面进行网络个体特征分析,探讨研究主题热点及关联性。结果与结论:“中药饮片”“加工炮制”“中药质量”“质量管理”等为中药安全研究领域的主
中国药房 2018年4期2018-09-10
- 基于向量空间模型结合语义的文本相似度算法
模型; 语义; 词频; 召回率; 特征项中图分类号: TN911.1?34; TP391.1 文献标识码: A 文章编号: 1004?373X(2018)11?0157?05Text similarity algorithm combining semantics based on vector space modelFENG Gaolei, GAO Songfeng(School of Mechanical?Electronic and Vehicula
现代电子技术 2018年11期2018-06-12
- 词频分析方法的扩散与滥用现象分析
?李明鑫摘 要 词频分析方法的应用已经从图情领域扩展到越来越多的其他学科领域,在促进各领域研究发展的同时,特定领域热点分析类文章的写作方式呈现出盲目扩散后的滥用现象。论文梳理和分析了国内外此类文章,总结了词频分析方法应用于热点分析类文章的基本状况。研究发现:此类文章存在写作模式化现象严重、方法使用不规范等问题。在此基础上,对此类文章在方法应用等问题上作出了探讨。关键词 词频 词频热点 文献计量学分类号 G256.1DOI 10.16810/j.cnki.1
新世纪图书馆 2018年3期2018-04-13
- 基于数据智能分析的C++课程的教学改革
手能力。关键词:词频;教学改革;智能分析中图分类号:TP312文献标识码:A传统的教学质量考核是基于试卷的考试结果来作为测量标准,比如平均分,分数的标准差等,而忽略了试题的难易、涵盖知识面的比例、学生运用知识的能力等因素。而且基于当前学生的考试成绩评价教学质量,因为样本量太小,得出的数据存在很大的不确定性,并不能合理的反映当前的教学方法存在哪些问题。同时,因为考题的随意性,学生掌握知识的程度也不能在考核结果中得到科学的、充分的体现,为了学生能够深刻掌握好C
求知导刊 2017年31期2018-03-21
- 基于词频分布的齐夫定律朝鲜语适用性研究
朝鲜语文本语料的词频统计和分析,列出词频统计表,绘出齐夫对数分布曲线,并与齐夫定律的分布曲线相比较,判断出吻合度,对齐夫定律进行朝鲜语适用性的验证研究。关键词:词频;排序;齐夫定律;朝鲜语适用性1 词频的定义与发展(1)表达意义的基本原子单位是词。例如house一词使人脑海里浮现一幅景象:一幢有房顶的长方形建筑。当house一词出现在一篇文本中时,读者便会依据其上下文去联想“房子”的意象。所谓词频是一种用于情报检索与文本挖掘的常用加权技术,用以评估一个词对
小说月刊 2017年12期2018-02-05
- 近20 a国际冰川研究热点及趋势分析
.冰川;关键词;词频;共词聚类分析;多维尺度分析冰川不仅是重要的淡水资源,同时敏锐地反映气候变化,对生态环境建设具有重要影响,与人类的生存环境密切相关[1].冰川的大规模进退,可以改变地貌,同时引起一系列的地质作用,例如地壳均衡调整,使海平面发生变化,改造水系和水文条件,引起生物的灭绝和变迁,从而改变整个地球的环境[2-4].通过对冰川活动的研究,能够得到地壳运动、生物环境变化等诸多信息.近年来,关于冰川方面的研究不断增多,但多数文章是基于某一区域的具体位
辽宁师范大学学报(自然科学版) 2017年4期2017-12-21
- 汉语阅读中词频与注视时间、跳读的关系
钱宗愉汉语阅读中词频与注视时间、跳读的关系钱宗愉采用眼动识别技术,在高频和低频基础上增加中频级别,探索词频与注视时间、跳读的关系。结果发现:词频效应显著,中频词对汉语双字词词汇加工的不同阶段影响不均衡。汉语阅读 词频效应 词汇识别 眼动一、前言在阅读过程中,词汇的识别和加工影响着对文本整体的理解,故研究者对影响词汇识别的因素加以操纵和控制,考察不同因素对信息通达的影响。其中词频一直备受关注,研究学者设计了大量的实验并对词频效应进行了验证和补充。但在以往研究
长江丛刊 2017年27期2017-12-01
- 希拉里2016总统败选演讲修辞与词频简析
ntConc分析词频和词汇特征,力求最大限度挖掘出演讲者的弦外之音。【关键词】希拉里;败选演讲;修辞;词频;语料库一、引言民主党候选人希拉里在此前结束的2016美国总统大选中,不敌共和党候选人特朗普,冲击总统宝座失败。希拉里本人也于投票结束第二天,发表了一篇承认其总统竞选失败的演讲。此篇败选演讲内容精彩,短小精悍,用词惊艳,值得一看。这于是为广大中国英语学习者提供了一篇极佳的学习素材。现针对其此篇演讲中使用的主要语言修辞手段和借助语料库软件下的词频试做简要
智富时代 2017年9期2017-11-04
- 图书馆与档案馆信息公开研究重点及趋势比较研究
;档案馆;共词;词频;知识图谱1 研究样本来源与分析工具本研究以CNKI(中国知网)为样本来源。分别以:题名=图书馆 and 题名=信息公开 (精确匹配) ,题名=档案馆 and 题名=信息公开 (精确匹配) 为条件进行检索得到的文献为样本。检索时间2017年4月12日。检索到2002-2017年档案文献141篇,2004-2017年图书文献229篇。2 共词网络比较图1、图2是档案馆和图书馆信息公开研究文献关键词共词知识图谱。从图1可以直观地看出:档案馆
档案管理 2017年5期2017-09-07
- 基于关键词共现网络的图书馆与档案馆互联网+研究比较分析
:文章运用关键词词频及共现网络分析法,对图书馆与档案馆互联网+研究进行比较分析,得出图书馆、档案馆两学科在互联网+研究上同年开始,时间短,目的一样,热点重点相似,发展趋势相近;但在规模、广度、与主业融合度和发展方向上有差异的结论。提出了图书馆应当从认识“互联网+”本质,掌握并主动运用互联网工具,树立互联网思维,主动融入,积极审慎地采取行动五方面展开与档案馆的互鉴研究的建议。关键词:互联网+;图书馆;档案馆;词频;知识图谱;比较1 研究样本来源与分析工具本研
档案管理 2017年4期2017-08-10
- 关于影响词汇通达因素的实验分析报告
。实验结果表明,词频,词长和词性都会影响词汇通达。本文还对实验结果做出了一定的解释。关键词:词汇通达;词频;词性;词长心理词典也称为心理词汇,指的是词与词的基本信息在人类心理的储存或表征(Elman,2004)。當我们把储存在心理的词汇激活,在我们的大脑中搜索到我们所需要的词汇信息时,就能识别目标词汇。词汇识别在语言认知研究中,是一个重要的领域。我们在识别词汇时,最常使用的实验就是词汇判断任务。该实验可以用来探寻词汇通达的过程。词汇通达会受到多种因素的影响
北方文学·下旬 2017年6期2017-07-04
- 词汇频率和频率分布对二语词汇习得影响研究综述
】二语词汇习得 词频 分布【中图分类号】H3194.110 【文献标识码】A 【文章编号】2095-3089(2016)27-0136-021.频率对二语习得影响1.1 频率效应从语言学的角度来看,频率(frequency)是指某语言条目在一个文本或者语料库中的出现次数(Rechards,2000)。Hatch 和 Gough(1976,in Larsen-Freeman,2002)首先提出了关于频率的假设。他们指出语言项目出现的频次越高,就会越早被学习者
课程教育研究·学法教法研究 2016年27期2017-04-21
- 英语学习者笔语中情态附加语使用情况调查及相应对策
附加语;语料库;词频;词汇密度;教学对策中图分类号:H319 文献标志码:A 文章编号:10017836(2017)03012703系统功能语法认为,语言除具有说话者亲身经历和内心活动的功能外,还具有表达说话者身份、地位、态度、动机和对其他事物的推断、判断和评价等功能,语言的这一功能被称为“人际功能”[1]。在英语中表达个人态度和评价意义有5种语法手段,包括状语(stance adverbials)、补语小句(stance complement claus
黑龙江教育学院学报 2017年3期2017-03-30
- 毛泽东话语的词语特征
:毛泽东;话语;词频;词语特征中图分类号:A41;H13; H15文献标识码:A DOI:10.3963/j.issn.1671-6477.2016.06.0036毛泽东话语无疑是中国当代最具代表性的权势话语,其影响,正如钱理群教授所指出的:“毛泽东是真正影响了生活在‘毛泽东时代的每一个中国国民的,而其隐性影响还传到了他们的后代。这就是说,中国国民性实际上已经经过了毛泽东的改造,时至今日,人们在观察大陆中国人的思想观念、思维方式、行为方式,以至言说方式时,
武汉理工大学学报(社会科学版) 2016年6期2017-01-10
- 结合汉明距离及语义的文本相似度量方法研究
;向量空间模型;词频—逆文本频率;语义;汉明距离0引言文本相似度计算作为文本信息处理的关键性技术,其准确率直接影响文本信息处理的结果.文本相似度表征文本间的匹配程度,相似度大小与文本相似程度成正比.目前,文本的相似度量方法主要分为基于统计学和基于语义分析两类[1].基于统计学的方法,典型的是向量空间模型(Vector Space Model, VSM),其优点是:以向量表示文本,简化文本中关键词之间的复杂关系,使模型具备可计算性[2].其缺点是:文本表示模
杭州电子科技大学学报(自然科学版) 2016年3期2016-08-02
- 词频分析及常用工具比较研究*
310023)词频分析及常用工具比较研究*左丽华(浙江工业大学图书馆,浙江 杭州 310023)[摘要]首先梳理了词频分析的一般过程并对现有词频分析工具总结归类。在此基础上,从软件基本信息、支持数据类型、数据预处理、数据分析与结果导出等方面对国内常用词频分析工具Bibexcel、CiteSpace和SATI进行了比较分析。并以WOS数据库为数据源,对3个软件实际分析结果进行比较,以期为科研人员使用词频分析方法提供有益的帮助。[关键词]词频分析Bibexc
图书馆学刊 2016年6期2016-07-25
- 关键词抽取策略研究
词:关键词抽取;词频;间距;词性;重要度随着现在信息技术和互联网的不断发展,信息文本的数量正呈爆炸式增长,人们如果想快速地从这些海量信息资源中查找出自己所感兴趣的内容,就需要抽取出其中的关键词,来代表文档的主要内容,方便人们查询。关键词自动抽取是利用计算机从文献中提取出反映主题信息的词语,是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。LUHN在20世纪50年代首次开展关于关键词自动抽取的实验后,相关领域内的研究就一直没有间断过,同时也不断出现
太原理工大学学报 2016年2期2016-06-18
- 一种基于词频歧义消解的通用中文分词法
06)一种基于词频歧义消解的通用中文分词法彭琦1,朱新华2,陈意山3(1.广西师范大学网络中心,广西桂林541004;2.广西师范大学计算机科学与信息工程学院,广西桂林541004;3.广西师范大学漓江学院,广西桂林541006)摘要:歧义是在基于词典的分词方法中常见的问题,以往的基于词典的分词方法往往使用双向最大匹配法获得分词结果后,通过使用上下文信息来进行歧义消解,但是对于没有上下文信息的单独语料无法进行歧义消解。本文提出一种通用的基于词频的歧义消解
广西师范大学学报(自然科学版) 2016年1期2016-05-31
- 以“新媒体时代高校如何开展思想政治教育”为主题的载文数据分析
关注点,对分词、词频进行统计,找寻理论共识并对研究方法建言献策。【关键词】新媒体;高校思想政治教育;数据挖掘;词频研究步骤主要分四个部分:首先,利用中国期刊网寻找近5年学界相关资料;其次,把数据进行归类汇总转变格式输入进rost6软件,进行社会网络和语义网络分析;接着,导出数据;最后对比数据进行分析。本研究侧重对词频和分词的数据诺列,找寻新媒体时代高校思想政治教育的理论研究点,从摘要,对策分析和结论三大模块进行统计,分析此研究方面的共同集合和侧重。一、新媒
都市家教·下半月 2016年2期2016-05-30
- 基于语料库的同义词组辨析*
——以adhere to,cling to,hold to为例
库(COCA)从词频、语域、搭配以及语义韵四方面比较区分同义词组adhere to,cling to,hold to的用法,旨在帮助英语学习者区分这三个词组的含义及用法,以期对教学及词典编纂提供有益借鉴。关键词:COCA语料库;同义词组;词频;语域;搭配;语义韵一、引 言《现代汉语词典》[1](P1265)里的同义词释义为“意义相同或相近的词,如‘教室’和‘课堂’,‘保护’和‘保卫’,‘巨大’和‘宏大’”,近义词[2](P121)则属于“广义上的同义词”,
湖州师范学院学报 2016年3期2016-05-14
- 基于语料库的同义副词辨析——以totally,completely,entirely,absolutely为例
库分析;近义词;词频;搭配一引言词汇学习是外语学习的重要组成部分,怎么区分同义词之间的细微差别一直是外语学习的一个重难点之一。同义词区分成为难点的原因在于同义词通过不同的方式,在不同的语境里或者从不同角度呈现某一意义和概念,所以一些学者认为实际上不存在意义上完全相同的同义词。Divjak &Gries指出没有任何两个词是完全同义的,它们在句法,语义,语用方面总是存在着细微差别。[1]Edmonds& Hirst 曾指出,可以从四个方面来区分同义词间的差异:
黑龙江工业学院学报(综合版) 2016年1期2016-05-14
- 汉字词频与客观口语词汇获得年龄关系的研究
3000)汉字词频与客观口语词汇获得年龄关系的研究孙娜娜(吕梁学院,山西 吕梁 033000)[摘要]词汇获得年龄和词频对词汇加工有重要的影响。通过选取551个音节的同音最高频词、同音中频词和同音最低频词作为调查词汇,让0-4岁幼儿的家长从中选取其孩子在该年龄阶段获得的词汇,收集AoA数据。根据调查结果探讨汉字词频和客观AoA的相互关系,研究发现客观AoA和词频有一定程度的相关,但并不完全一致。此研究结论可以为心理语言学研究实验材料的选择提供依据。[关键
安阳师范学院学报 2015年3期2015-12-17
- 《中国中医药学主题词表》中医药学及其相关学科类主题词修订选词研究
表编制原则,根据词频统计和数据库检索结果,参考《医学主题词表》(MeSH)等相关资料,完成TG类主题词的修订。结果 新版《词表》TG类主题词拟新增“医学,韩国传统”“中医体质类型”等35个主题词,拟删除“医学,东方传统”“经络带”等35个主题词,拟修改“四象医学”“民族医药学”等19个主题词。并统一“民族医药学”行文格式,协调“中医药学”与其他类主题词交叉的问题。结论 TG类主题词选词应基于词频统计,主题词的词形应规范描述,符合教材与文件,并注意与其他类主
中国中医药信息杂志 2015年7期2015-05-30
- 词频,一部隐秘的历史
公开,但关于书的词频统计结果可以公开。输入任意一个词语,都会出来一幅像股票价格走势一样的词频走势曲线图。当我们输入“市场”和“价格”这两个词语后,会发现“价格”词频走势的第一个高点出现在1955年,然后就一个猛子扎进海底;到了1967年,这个词语几乎消失在词语的海洋中;然而在1976年,这个词语以45度角的姿态重新跃出水面,向上飞腾。而“市场”这个词的词频走势表现更让人惊叹,它的曲线在20世纪40年代只是有一些小的波动,和“价格”一样,它在1976年左右猛
读者·校园版 2015年7期2015-05-14
- 谈常用字词的选取及其等级划分
常用词 字频 词频一、引 言为了适应外国人学汉语的需要,教育部和国家语言文字委员会在2010年10月发布了《汉语国际教育用音节汉字词汇等级划分》(以下简称《等级划分》)。作为国家语言文字规范,《等级划分》里的《分级汉字表》和《分级词汇表》与《汉语水平词汇与汉字等级大纲》(以下简称《大纲》)里的《HSK等级字表》和《HSK等级词表》相比,常用字和常用词的选取更准确,等级划分更简明。《大纲》将字和词分别分为甲、乙、丙、丁四级,《等级划分》将字和词分别分为一级
辞书研究 2014年2期2015-05-11
- 儒法两家经典的共词分析与研究*
目“儒法两家经典词频及共现分析与研究”(编号:TJTQ13-013)的成果之一。儒法两家经典的共词分析与研究*天津市哲学社会科学研究规划项目“儒法两家经典词频及共现分析与研究”(编号:TJTQ13-013)的成果之一。摘要以儒家经典及译文为数据来源,借助计算机对原文及译文词语进行挖掘、整理,建成词语频率数据库,采用词频分析软件,应用词频分析方法,对高频词进行多角度的比较研究,探讨儒法思想精髓及其异同点,开拓我国儒法经典以及古典文献研究的新途径。关键词儒法经
大学图书馆学报 2015年2期2015-02-20
- 儒家经典词频及共现分析
CiFreq 字词频率统计工具,采用定性和定量相结合、内容和同特征相结合的分析方法,对大量数据进行词频分析研究,找出儒家经典精髓及异同点,得出儒家经典学科的发展规律及结构状况,为儒家经典深入研究及古典文献的研究提供理论依据和实用性帮助。由于研究目的是研究儒家经典论述思想,不是专门的语言文学研究,为了便于通过词语分析儒家经典主导思想,特采用儒家经典原文和译文统一进行词频和共现研究。以便于更准确和全面地把握儒家经典思想。2 儒家家经典词频及共现分析与研究热点分
江苏科技信息 2014年15期2014-04-17
- 汉语音节累积词频对同音字听觉词汇表征的激活作用*
《现代汉语常用词词频词典》(刘源 等, 1990; 以下简称《词频词典》), 可以发现包含两个或两个以上同音字的音节平均有5.67个同音字(中位数是7.5个), 多者例如音节/yì/对应48个汉字。拼音语言的同音异形词较少, 词汇歧义较多出于同音同形(homographic)。为了具有可操作性, 本文谈到的汉语音节是带声调的(音/ma1/与/ma2/是不同音节),单音节“词”和“字”, 都是指中文信息处理词切分意义上的单字词(见刘源等, 1990; 孙茂松
心理学报 2014年4期2014-02-02
- 非英语专业低年级大学生产出性词汇研究
文本产出性词汇的词频分布、词汇丰富性和准确性,得出结论:文理科非英语专业低年级大学生大都依赖一、二级高频词汇,成绩差的学生过度依赖高频词;一些学生词汇产出不丰富、不准确。本文提出可以通过词块教学,注重词汇基本功,增加词汇输入和产出等方式提高学生词汇产出能力。关键词:产出性词汇;词频;词块;词汇丰富性;错误 中图分类号:H319.3 文献标识码:A 文章编号:1000-0100(2009)03-0117-4A Study of Productive Voca
外语学刊 2009年3期2009-06-04