高被引论文|学者|科学家

高被引论文的阈值究竟是指什么呢?

editor
发表于 2025年10月13日

大家好!小编今天和大家分享的知识点是高被引论文的阈值概念~

高被引论文的 “阈值”,并非一个固定不变的、适用于所有情况的统一引用次数数字(如 “被引 50 次就是阈值”),而是由权威引文数据库(核心为 Web of Science 旗下的 ESI)根据学科差异、时间窗口、同期论文引用分布动态计算出的 “相对标准”—— 本质是 “某一范围内论文的引用排名临界点”,核心规则可拆解为以下三方面:

一、阈值的核心逻辑:“学科 + 时间” 双重归一化
由于不同学科的引用习惯、论文数量差异极大(如医学论文平均引用次数远高于数学,材料科学论文引用高峰比人文学科更集中),若用统一引用次数作为阈值,会严重偏离 “高影响力” 的本质。因此,阈值的计算必须先进行归一化处理,具体分两步:
(1)按学科划分阈值ESI 将所有论文划分为 22 个一级学科(如 “临床医学”“计算机科学”“物理学”“社会科学总论” 等),每个学科单独计算阈值。
例 1:“临床医学” 领域论文数量庞大、交叉研究多,引用频次普遍较高,其高被引阈值可能是 “过去 10 年该领域论文被引次数前 1% 的临界值(比如某年度为被引 80 次)”。
例 2:“数学” 领域论文更侧重理论突破,引用周期长、频次低,其高被引阈值可能仅为 “过去 10 年该领域论文被引次数前 1% 的临界值(比如某年度为被引 25 次)”。
二者阈值差异显著,但本质都是 “本学科内的前 1%”,确保了不同学科高被引论文的 “影响力含金量” 对等。
(2)按时间窗口限定阈值高被引论文的判定仅针对 “过去 10 年” 内发表的论文(ESI 数据库每 2 个月更新一次,时间窗口随更新动态滚动,如 2025 年更新时,仅统计 2015-2025 年发表的论文)。这一规则避免了 “老论文靠时间积累引用次数” 的不公平 —— 例如,2024 年发表的论文,不会与 1990 年发表的 “经典老论文” 直接对比,而是与同期(2014-2024 年)发表的同领域论文竞争 “前 1%”,确保阈值反映的是 “近期学术影响力”。

二、阈值的具体计算:“前 1%” 的引用排名临界点
在 “学科 + 时间” 的框架内,阈值的具体数值由以下步骤确定:
1.筛选论文池:提取某一学科(如 “化学”)在 “过去 10 年” 内发表的所有可被 ESI 收录的论文(含 Article、Review 等,排除会议摘要、快讯等短文献)。
2.排序与统计:将这些论文按 “被引次数” 从高到低排序,计算总论文数量的 1% 对应的位置(如该学科 10 年内共发表 10 万篇论文,前 1% 即前 1000 篇)。
3.确定阈值:排名第 1000 位的论文的 “被引次数”,即为该学科、该时间窗口下高被引论文的阈值。若某篇论文的被引次数≥该阈值,则被判定为 “高被引论文”;若恰好有多名论文并列第 1000 位(如第 1000、1001、1002 篇均为被引 50 次),则这些论文会全部被纳入高被引范围,此时阈值仍以该并列次数(50 次)为准。

三、阈值的关键特征:动态变化,无固定标准
高被引阈值并非 “一劳永逸”,而是随以下因素动态调整,导致同一学科在不同时间、同一时间不同学科的阈值均不相同:
1.学科发展速度:若某学科(如 “人工智能”)近期研究热度飙升,论文发表量和引用频次快速增长,其高被引阈值会随之升高(比如去年阈值是被引 60 次,今年可能升至 75 次)。
2.时间窗口更新:每 2 个月 ESI 更新时,时间窗口向前滚动,部分 “满 10 年” 的旧论文被移出统计池,新论文加入,会改变该学科的论文总量和引用分布,进而调整阈值。
3.引用行为变化:若某领域出现 “颠覆性成果”(如 CRISPR 基因编辑技术),相关论文被引爆发式增长,可能拉高该领域整体引用水平,间接推高阈值。

所以,如果若需查询某一学科、某一时间的具体阈值,可通过 Web of Science 数据库的 ESI 模块,查看 “高被引论文” 的引用次数分布,其最低值即为该时段的阈值。

评论已关闭。