學術領域無人不知無人不曉的湯森路透基于文章的被引量會發布一個期刊引證報告,報告的核心指數稱之為影響因子。
影響因子(Impact Factor,IF)是湯森路透(Thomson Reuters)出品的期刊引證報告(Journal Citation Reports,JCR)中的一項數據。 即某期刊前兩年發表的論文在該報告年份(JCR year)中被引用總次數除以該期刊在這兩年內發表的論文總數。這是一個國際上通行的期刊評價指標。
影響因子現已成為國際上通用的期刊評價指標,它不僅是一種測度期刊有用性和顯示度的指標,而且也是測度期刊的學術水平,乃至論文質量的重要指標。
谷歌學術也采用了相似的H指數作為學者和期刊評價的標準:
所以我在想,公眾號的文章可不可以引入這么一個“被引量”指標,用以評價一篇文章或者一個公眾號的水平呢?
學術文章的被引量很容易計算,因為國家有明確的法律法規和標準,只要有足夠全的學術文章便可以計算出某篇文章的被引量。
對于公眾號來說,計算被引量所需要的數據也是完善的。
首先,功能層面
2017年6月6日,公眾號開放了“插入全平臺已群發文章鏈接”的功能
這個功能的開放為添加“參考文獻”提供了可能。
然后,數據層面
目前內容創業服務公司新榜保持每天對44.8萬個公眾號文章的采集工作,幾乎包含了所有活躍的公眾號。這部分公眾號的文章在新榜數據庫是可檢索的。
最后,技術層面
要獲取文章的“被引用”情況,首先需要知道文章的被引用的情況,然后需要知道文章的來源(即公眾號)。
而這兩個數據,也是全部可以得到。
文章引用行為的獲取
我們打開一篇“引用了”其他文章的公眾號文章,F12檢查文章的源代碼可以看到,文章是以超鏈接的形式出現的:
所以在采集文章時,如果在源代碼中采集到
<a herf = “http://mp.weixin.qq.com/s?__biz********************* “>文本</a>的字段,則可以認為此處有“引用”行為。
引用來源分析
找到了文章的引用行為,我們需要對被引用的文章進行分析,分析的核心在就于這篇文章的鏈接,也就是剛才herf后面的那一串。
幸運的是,微信在鏈接里保存了我們需要的所有數據。
以剛才那篇文章的鏈接為例:
http://mp.weixin.qq.com/s?__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
我們把鏈接分為三部分:
http://
mp.weixin.qq.com/s
__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
了解鏈接組成的同學們應該知道,前兩部分是鏈接的主題,每個文章的鏈接都是一樣的。關鍵信息在于“?”后面的部分。
在鏈接里,“?”后面的部分是鏈接的傳參,顧名思義,就是向服務器傳遞的參數,是對鏈接的解釋(或者叫備注)。
觀察鏈接里的參數,有五個:
__biz
mid
idx
sn
chksm
我們這里只用到前兩個參數:
__biz可以認為是微信公眾平臺對外公布的公眾帳號的唯一
idmid是圖文消息id
通過__biz參數可以獲得公眾號的ID數據,是唯一識別的,目前技術上可以轉化成賬號的;
通過mid參數,我們則可以定位到文章的ID,也是唯一識別的。
到此,對于文章引用行為技術層面的問題都已經解決。
“被引量”的使用
和學術領域相同,一篇文章被引用一次,則代表該文章影響力+1,被引量越多,文章影響力就越高。
對于公眾號而言,可以使用賬號所有文章的被引量計算賬號的“影響因子”,可以使用SCI的計算方法,也可以使用GoogleScholar的H-index的計算方法。
和學術領域相同,文章也存在”自引“和”負引用“的問題。
自引在學術領域是一個不怎么受待見的事情,因為“被引量”這個指標已經作為一種評價標準,引用自己的文章給自己+1這種行為不是很好看。
負引用這件事在學術領域還不那么嚴重,一篇論文的結論不管對錯,學術層面的價值是存在的。但是在媒體行業就不同了,畢竟媒體很多時候傳遞的是價值觀。比如某篇文章觀點偏激,被全網噴,我們只能說那篇文章影響力高,但是價值就沒多少了。
這里我們就不深入討論了。
最后說點啥
目前的內容行業,充斥著營銷號、流量號,一群自媒體人聚在一起不是討論什么樣的文章有價值、什么樣的內容有深度,而是討論今天的收益如何、多少閱讀量才能開通流量主。
我們每天僅有的幾分鐘閱讀時間里,有一半浪費在那些“聳人聽聞”但毫無營養的標題黨上,反而那些報道事實、傳遞價值的深度內容或因為文字太長、或因為標題不夠吸睛,被淹沒在這爆炸的信息海洋中。
是時候該有人站出來做點什么了,比如給內容行業也加入一個讓死學術圈欲仙欲死的“影響因子”。
本文地址:http://murenxiang.com.cn//article/2020/0708/18527.html