《中國文檔名詞發(fā)展演變史檔案學(xué)、文書學(xué)之歷史語言學(xué)研究》是漢語言文書、檔案類名詞的發(fā)展通史,從商朝甲骨文開始,對(duì)文書、檔案領(lǐng)域中文書檔案公文文件案卷等 320 余個(gè)名詞主要從詞義角度進(jìn)行了起源、發(fā)展的歷史考證。書中將文檔名詞分為文族書族牘族籍族圖族令族簿族典族冊(cè)族令族等 13 個(gè)名詞聚類,創(chuàng)造性地進(jìn)行了族類名詞的整體分析。書中全面地使用了計(jì)量語言學(xué)、計(jì)量史學(xué)的研究方法,從數(shù)字人文的角度進(jìn)行了大規(guī)模數(shù)據(jù)庫文獻(xiàn)檢索,用翔實(shí)的數(shù)據(jù)說明了名詞使用頻率的變化。
《中國文檔名詞發(fā)展演變史》特色鮮明,系統(tǒng)梳理了從先秦至民國文檔名詞的發(fā)展脈絡(luò),運(yùn)用計(jì)量語言學(xué)等方法深入研究,以大量文獻(xiàn)為依據(jù),詳細(xì)闡述各時(shí)期特點(diǎn)及影響因素,兼具學(xué)術(shù)性與可讀性,是檔案學(xué)、語言學(xué)等領(lǐng)域研究的重要參考書籍。
本書是一部具有較高學(xué)術(shù)價(jià)值的專著。本書系統(tǒng)梳理了中國文檔名詞從先秦至民國的發(fā)展脈絡(luò),詳細(xì)闡述了各時(shí)期文檔名詞的演變歷程,對(duì)了解中國文化傳承與發(fā)展意義重大。作者運(yùn)用計(jì)量語言學(xué)等方法,通過大量文獻(xiàn)檢索與數(shù)據(jù)分析,深入探究文檔名詞的起源、發(fā)展規(guī)律,以及政治、文化等因素對(duì)其的影響,使讀者能清晰把握其發(fā)展軌跡。書中不僅對(duì)常見文檔名詞進(jìn)行解讀,還對(duì)一些易混淆或鮮為人知的名詞進(jìn)行辨析,為檔案學(xué)、語言學(xué)等領(lǐng)域的研究提供了重要參考。無論是專業(yè)研究者還是對(duì)歷史文化感興趣的讀者,都能從本書中獲得對(duì)中國文檔名詞及相關(guān)歷史文化的深刻認(rèn)識(shí),是一部不可多得的佳作。
專業(yè)語言的歷史實(shí)證研究(代序)
本書是筆者主持的國家社科基金一般項(xiàng)目中國文檔名詞發(fā)展演變史(14BTQ071)的最終成果。
一、研究對(duì)象
名詞,是人對(duì)特定的客觀事物的符號(hào)性表述。這種表述(名稱)是人們?cè)谡J(rèn)識(shí)世界、理解世界的活動(dòng)過程中獲得的,其對(duì)象是那些具有獨(dú)立特征的某一個(gè)或存在共性的某一類事物。這個(gè)名稱確立后,會(huì)在人類認(rèn)識(shí)發(fā)展過程中得到不斷的修正與完善。名詞的產(chǎn)生與發(fā)展,表面上是語言問題,而本質(zhì)上是人類思想認(rèn)識(shí)問題。詞匯,不僅僅是語言,更是一種概念、一種思想。對(duì)它們的研究,是構(gòu)建人類思想史、認(rèn)識(shí)史的一個(gè)重要方面。
專業(yè)語言,對(duì)于一個(gè)專業(yè)領(lǐng)域而言具有極其重要的意義。普通人也說文書和檔案,但那只是一種一般意義上的名稱,不是一種專業(yè)的概念認(rèn)識(shí)。他們?cè)谡f這些名詞時(shí),沒有專業(yè)研究員頭腦中的那些豐富、精確的概念認(rèn)識(shí)。作為概念的專業(yè)名詞,它是建立在通曉專業(yè)歷史和成就的基礎(chǔ)上的。非專業(yè)地使用名詞與專業(yè)地使用概念,是非專業(yè)與真專業(yè)的明顯區(qū)別。
作為專業(yè)的研究者,我們的確要比非專業(yè)人士對(duì)專業(yè)名詞了解得更多。但
這就夠了嗎?黑格爾說,人們對(duì)自己經(jīng)常掛在嘴邊的名詞往往是最無知的。雖
然作為研究者,我們對(duì)本專業(yè)的這些名詞比普通人了解得多一些。但如果認(rèn)真
推敲起來,說起這些名詞的來源、演化,我們大多知之不詳、知之不確。這種
無知,會(huì)使我們的專業(yè)性受到質(zhì)疑,會(huì)使我們學(xué)科的成熟性受到質(zhì)疑。專業(yè)語
言的成熟,從來都是專業(yè)成熟的顯著標(biāo)志之一。
關(guān)于文檔名詞的研究,是文書術(shù)語學(xué)、檔案術(shù)語學(xué)、文書史、檔案史等學(xué)科重要的基礎(chǔ)性的組成部分。在古代漢語中,人們對(duì)文書和檔案這兩種事物的認(rèn)知區(qū)分還不是十分清晰,反映為名稱上的區(qū)分也不是很明顯,同一個(gè)名詞常常兼具文書和檔案兩方面的含義,它們之間聯(lián)系緊密。歷史時(shí)代越早,這種情形就越明顯;诖,本書將兩者作為共同的研究對(duì)象,即我們研究的是文檔名詞,而不只是檔案名詞或文書名詞。當(dāng)然,由于現(xiàn)代社會(huì)名詞的專業(yè)化程度大大提高,我們就改為以檔案名詞為主了。
在語言學(xué)中,研究某一專業(yè)或行業(yè)語言的部分,被稱為專業(yè)或行業(yè)語言學(xué)。在專業(yè)語言學(xué)中,語音與語法不是研究的重點(diǎn),詞匯是它們的主要研究對(duì)象。而專業(yè)詞匯又以名詞為主,這是本書以文檔語言中的名詞作為研究對(duì)象的主要原因。
名詞是由詞素構(gòu)成的,據(jù)此,我們將具有同一詞素(根詞)的名詞歸為一類,稱為名詞族類,這是一種詞匯聚類研究方法在文檔名詞研究中的應(yīng)用。具體而言,我們從文檔語言的特殊性出發(fā),在文檔族類特征方面,歸納出以下族類文檔名詞:文族書族案族簿族籍族冊(cè)族卷族牘族典族圖族檔族等。這些族類將文檔名詞劃分為組或群,以一個(gè)群組為研究對(duì)象,即按照文檔名詞整體文檔名詞族類文檔名詞個(gè)體的研究路徑展開,可以幫助我們更好地從整體到個(gè)體分析文檔名詞的詞義與使用情況。
此外,文檔名詞族類中的很多名詞往往可以分屬兩個(gè)不同族類,即構(gòu)成該詞的兩個(gè)詞素分屬兩個(gè)不同的族類,如案牘案卷文案等,它們既都屬于案族文檔名詞,也分別屬于牘族卷族文族文檔名詞。
在統(tǒng)計(jì)時(shí),這些交叉的名詞我們?cè)诓煌淖孱愔薪约{入統(tǒng)計(jì)范疇,不在整體中加以剔除,以保持各族類本身的完整性。但在具體論述時(shí)會(huì)有所側(cè)重、取舍,盡量避免較多的交叉與重復(fù)。
多數(shù)情況下,一個(gè)名詞會(huì)具有多個(gè)義項(xiàng)。而這些義項(xiàng)往往并不都是指代文檔類事物的,也會(huì)包含其他事物或概念,而本書中所研討的主要是該名詞的文檔類含義和用法。如文字一詞,《漢語大詞典》中有3個(gè)義項(xiàng)、6種含義,在大多數(shù)情況下它是指記錄語言的書寫符號(hào),古漢語中多指單字。比較這6種含義,僅有公文;案卷指奏疏或札子屬于文檔名詞的范疇,即文字一詞僅在這兩種用法中指代文書檔案類事物,因此檢索結(jié)果和統(tǒng)計(jì)數(shù)據(jù)均在這兩種用法(文檔含義)的范疇內(nèi)篩選和計(jì)算,即一般只統(tǒng)計(jì)其文檔含義的部分,以確保數(shù)據(jù)的準(zhǔn)確性和可靠性,避免含義混淆、數(shù)據(jù)泛化。
本書的選詞范圍較大,總數(shù)多達(dá)200余個(gè)。在名詞范圍上達(dá)到了前所未有的水平,具有較高的全面性。如文族名詞就包括文、文卷、策文、公文、文典、文字、文告、文憑、文契、文墨、文款、文疏、文牒、文榜、文誥、文翰、文歷、文學(xué)、文驗(yàn)、文解、文稿、文檄、文引、文札、文示、文表、文帖、文券、文狀、文奏、文按、文計(jì)、文約、文記、文帳、文移、文符、文獻(xiàn)、文證、書文、文書、文案、文牘、冊(cè)文、文冊(cè)、典文、圖文、文簿、中古文、架閣文字、架閣文書等51個(gè)文檔名詞。
當(dāng)然,即使達(dá)到如此之大的選詞范圍,但在浩瀚的詞匯海洋面前,遺漏仍然是難免的,有待我們繼續(xù)挖掘。
- 主要基于數(shù)據(jù)庫文獻(xiàn)之檢索、分析的較大數(shù)據(jù)量抽樣統(tǒng)計(jì)法
本書采用了計(jì)量語言學(xué)的方法進(jìn)行歷史語言學(xué)的研究。它需要兩個(gè)重要前提:第一,歷史上連續(xù)的文獻(xiàn)遺存。對(duì)于古代語言,特別是文檔語言(具有明顯的書面語言特點(diǎn)),我們主要從各個(gè)時(shí)期的書面文獻(xiàn)來考察。如果文獻(xiàn)是斷斷續(xù)續(xù)的,數(shù)量很少,就難以達(dá)到較好的效果。在這一點(diǎn)上,我們要感謝我們偉大的祖先,從商代開始,就給我們留下了大量的連續(xù)的文獻(xiàn)資料,不但經(jīng)史子集汗牛充棟,小說、筆記也數(shù)不勝數(shù)。這是本書開展研究的必要條件之一。第二,數(shù)據(jù)庫的建設(shè)與運(yùn)用。我們進(jìn)行了大數(shù)據(jù)量的統(tǒng)計(jì)工作,如果沒有網(wǎng)絡(luò)數(shù)據(jù)庫這樣的工具,手工完成是很困難的,甚至說是不可能完成的。
盡管本書的數(shù)據(jù)量很大,但使用的仍是抽樣統(tǒng)計(jì)法,即在從全部研究對(duì)象(古代文獻(xiàn))中抽取一部分對(duì)象(筆者當(dāng)時(shí)所能查到的全部數(shù)據(jù)庫文獻(xiàn)及部分紙質(zhì)文獻(xiàn))進(jìn)行調(diào)查并取得資料的基礎(chǔ)上,運(yùn)用數(shù)理統(tǒng)計(jì)的原理,對(duì)整體做出數(shù)量上的估計(jì)判斷,從而對(duì)認(rèn)識(shí)對(duì)象得出大致結(jié)論。抽樣法也叫取樣法,統(tǒng)計(jì)學(xué)中稱為抽樣推斷法,是統(tǒng)計(jì)方法在社會(huì)科學(xué)領(lǐng)域的應(yīng)用。這種統(tǒng)計(jì)工作,成功與否、效果如何主要取決于研究人員對(duì)統(tǒng)計(jì)樣本的選擇。本書主要采用整群抽樣法,即古代以《國學(xué)寶典數(shù)據(jù)庫》《愛如生中國基本古籍?dāng)?shù)據(jù)庫》所收全部古籍文獻(xiàn)等為統(tǒng)計(jì)對(duì)象,現(xiàn)代則以年鑒數(shù)據(jù)庫為統(tǒng)計(jì)對(duì)象,對(duì)這些群體對(duì)象進(jìn)行調(diào)查統(tǒng)計(jì),以期獲得較佳的結(jié)果數(shù)據(jù)。
本書所進(jìn)行的檢索統(tǒng)計(jì),樣本主要來源于《國學(xué)寶典數(shù)據(jù)庫》、《愛如生中國基本古籍?dāng)?shù)據(jù)庫》(2016年年底)和《四庫全書數(shù)據(jù)庫》(2016年)所包含的書籍及一些特殊文獻(xiàn)(如甲骨文匯編、金文匯編等),并參考了讀秀等中文數(shù)據(jù)庫。在古文獻(xiàn)樣本選擇上,我們首先選擇了《國學(xué)寶典數(shù)據(jù)庫》,因?yàn)樗悄壳皣鴥?nèi)數(shù)據(jù)量較大、檢索較便利的數(shù)據(jù)庫。但這個(gè)數(shù)據(jù)庫有一些缺點(diǎn),如部分文獻(xiàn)時(shí)代歸屬不準(zhǔn)確、內(nèi)容有錯(cuò)誤、部分重要文獻(xiàn)缺失等。所以我們采取了一些補(bǔ)救措施,如:在文獻(xiàn)年代歸屬上,我們都在進(jìn)行研究后確認(rèn)或訂正;在內(nèi)容上,我們逐一對(duì)照權(quán)威紙本或紙本的掃描電子版,并以紙本作為參考文獻(xiàn)注釋的依據(jù);在重要文獻(xiàn)缺失問題上,如甲骨文獻(xiàn)、金文文獻(xiàn)、《清實(shí)錄》等,我們就不能單純依賴該數(shù)據(jù)庫了,通過其他數(shù)據(jù)庫(如《愛如生中國基本古籍?dāng)?shù)據(jù)庫》、《四庫全書數(shù)據(jù)庫》、讀秀等)和紙本文獻(xiàn)來彌補(bǔ)。
…………