本書對數據科學領域應用廣泛的R軟件包在科學計量數據分析中的實踐進行了系統(tǒng)性介紹。按照問題、方法、案例的模式,對R中可進行科學計量數據分析和可視化的工具包進行了介紹和演示。本書是對CiteSpace、VOSviewer以及BibExcel等科學計量和知識圖譜系列圖書的補充。
本書可作為圖書館和情報學專業(yè)、醫(yī)學和生物信息專業(yè)、公共管理專業(yè)、管理科學與工程(科技管理、信息管理)專業(yè)、教育信息以及數據或信息可視化研究方向本科生和研究生的實踐教材,也可作為相關領域科研人員日常科學研究甚至科技管理和政策分析的工具書。
前言
當前,我們處于科學文獻大數據時代。面對海量的文獻我們如何快速地了解一個研究領域、研究方向或者主題的整體格局以及未來的趨勢?在此背景下,與該問題直接相關科學計量理論、方法和技術適時發(fā)展,成為解決上述科研問題的一種有效的途徑。掌握科學計量相關的技術和方法也成為科研工作者在新時代進行科學研究活動的基本技能。在過去十余年里,科學計量數據可視化的理論與方法已經大量地滲透到其他學科的研究實踐中。在國內這種以科學文本數據為研究對象,通過可視化技術來揭示學科結構、演進和互動的研究領域被統(tǒng)稱為“科學知識圖譜”。
科學計量數據可視化背后涉及了大量的科學計量學(還包含文獻計量學、網絡計量學以及信息計量學)方面的基礎理論,比如論文的作者生產率分布、論文的共被引、耦合、主題共現(xiàn)以及作者合作等。還包含了統(tǒng)計學和網絡科學等方面的技術和方法,比如多維尺度分析、聚類分析、復雜網絡分析、自然語言處理和文本挖掘等分析方法。上面的理論和方法構成了進行科學計量數據可視化分析的知識基礎,是進行知識圖譜分析的前提。在理論和方法的支持下,當前國內外的相關學者已經開發(fā)了數十種進行科技文本挖掘方面的軟件或者工具包,這些知名的工具包含了HistCite、BibExcel、CiteSpace、SCI2以及VOSviewer等。這些工具為有意借助領域文獻分析以獲取學科研究格局和動態(tài)的學者提供了可能。
筆者在過去5年從事科學計量和知識圖譜的實踐研究中,相繼撰寫了關于CiteSpace、VOSviewer以及BibExcel等方面的書籍,主要目的在于幫助非科學計量學領域的學者快速應用該方法輔助科學研究。從2016年開始已經相繼組織了4次與科學計量和知識圖譜相關的活動,與來自國內的數百名知識圖譜愛好者有過交流。在交流中,最為常見和令我反思的一個問題是:“我得到的圖譜結果應該怎樣解釋呢?”我認為科學計量及知識圖譜的方法僅僅給我們提供了一種認識知識世界的新方式,但這種認識方式更需要知識圖譜實踐者結合自身的專業(yè)背景和知識圖譜的理論與方法去思考。在進行科學計量和知識圖譜分析的時候,讀者一定要明確自己要解決的問題是什么?以及為什么知識圖譜能夠解決提出的問題,它與其他方法相比優(yōu)勢在哪里?等等。即科學計量和知識圖譜分析之前,一定要確定自己所要研究的問題,然后來選擇要使用何種知識圖譜呈現(xiàn)方式來解決問題。
本書是《CiteSpace:科技文本挖掘及可視化》、《科學計量與知識網絡分析——基于BibExcel等軟件的實踐》、《科學知識圖譜原理及應用——VOSviewer與CiteNetExplorer初學者指南》的姊妹篇。與前面這些應用程序不同的是,該書詳細介紹了意大利那不勒斯菲里德里克第二大學(University of Naples Federico II)經濟與統(tǒng)計系Massimo Aria和Corrado Cuccurullo基于R語言開發(fā)的BIBLIOMETRIX工具包(Version 1.6和1.7)[1]。該R工具包基本上涵蓋了進行科學計量和知識可視化的功能(圖0. 1),可以滿足愛好R軟件,并試圖使用R進行科學計量和知識圖譜分析的讀者。在此基礎上,對于科學計量與知識圖譜相關的一些R工具包,rAltmetric、wordcloud2、gender以及tidytext等工具包進行了介紹。本書對使用R進行英文全文本挖掘進行了很少的介紹,對中文本全文本挖掘還尚未涉及。在今后的更新中將對使用R進行全文本挖掘進行適當的完善。
圖0. 1 bibliometrix功能概覽
為了便于讀者熟悉bibliometrix工具包,大多數的案例運行采用了工具包自帶的數據,一些案例專門下載了Web of Science和Scopus數據集進行分析。呈現(xiàn)可所分析的結果,但并未就結果進行描述性或者帶有特定研究目的的解讀。通過對這些結果的學習,讀者可以自己去思考可以做些什么?或者至少可以通過這種方法了解一下自己所關注的領域哪些情況?
本書在撰寫中有如下約定:
>后為代碼
#為代碼的說明
## 為代碼運行的結果
感謝Massimo Aria和Corrado Cuccurullo在本書寫作過程中給予的大力幫助,并為本書所撰寫英文序言。感謝首都經濟貿易大學出版社楊玲社長在科學計量與知識圖譜系列叢書出版中的極大支持,感謝中國科學院李彬彬博士在提取子矩陣問題上的幫助,感謝滑鐵盧大學博士后于淼對文稿提出的修改建議,感謝本書的責任編輯薛曉紅以及研究生李平對本書詳細校對。
回首自己在科學計量和知識圖譜研究與實踐上的經歷,感受五味雜陳。衷心地期望本書及其相關系列叢書能進一步促進科學計量與知識圖譜實踐研究在國內的發(fā)展和普及,并使每一位讀者受益。
李杰
2017年7月于
李杰,男,管理學博士。上海海事大學海洋科學與工程學院安全科學與工程系講師、安全科技趨勢研究中心常務副主任、科技情報研究所高級研究員,北京理工大學博士后(在站),F(xiàn)rontiers in Research Metrics and Analytics編委。
曾在首都經濟貿易大學、斯泰恩拜斯大學(德國)、臺灣省中華大學、代爾夫特理工大學(荷蘭)學習或研究。研究方向主要集中在安全科學管理、科學計量學以及應用科學知識圖譜等領域。已發(fā)表論文50余篇,出版著作5部,包括《CiteSpace科技文本挖掘及可視化》《科學計量與知識網絡分析》《安全科學技術信息檢索基礎》等。