臺灣文學數位資料庫重要拼圖:《聯副七十》的典藏、檢索與計量
文|黃美娥(臺灣大學臺灣文學研究所教授)
圖︱聯合知識庫
近兩年多來,由於COVID-19新冠肺炎席捲全球,疫情不僅為人類日常生活秩序帶來諸多困擾,也對全球教育造成巨大影響,強力衝擊了教學模式與學生學習樣態。在最嚴重時期,許多學校被迫取消實體課程,改而採取線上方式授課,而教職人員的跨域、跨國學術移動也因此暫停,公私立圖書館則紛紛關閉。於是,學校教育和學術研發,都被迫進入一個不同以往的新生態系。儘管如此,無論教師或學生,只要對於數位學習不陌生,必然很快體會到若能駕馭數位科技和資料庫,就可突破遭受阻隔的現實障礙,而有餘裕回應林林總總問題的探索需求。
正因如此,突如其來的疫情,反倒強化數位資料庫的存在價值,並促成了檢視晚近三十年來世界各國致力增設資料庫成果的最佳時機。實際上,早在1990年美國國會圖書館的「美國記憶」將館藏數位化上線以供檢索,不少國家也有了形形色色資料庫的設置計畫,並且果實纍纍。以較早著手的日本國立國會圖書館而言,在1998年提出「電子圖書館構想」,從2001年起對其收藏資料進行數位化處理,截至2021年7月,也已完成了約279萬件進行數位化。而在留意各國資料庫建置情形時,筆者因為研究興趣所在,特別好奇於各國報刊資料庫,例如美國斯坦福大學胡佛圖書館,即將近代日本在海外創辦的報紙全文數位化;再如韓國國立圖書館,亦將韓國近代上百種報紙全文掃描,這些報紙以19世紀晚期和20世紀前半期為主。他如新加坡國立大學圖書館,廣泛蒐集東南亞地區發行的中文報紙,其中新加坡發行者96種,馬來西亞發行者34種,自2005年以來持續進行數位化,目前已完成至少21種新加坡報紙和6種馬來西亞報紙。又,在亞洲之外,歐盟成員國共同建立了一個超大型的網上歐洲文化資料庫,其中報刊部分,使用語言便涵蓋德文、法文、拉丁文、荷蘭文、波蘭文、塞爾維亞文、芬蘭文等,時間則以19世紀和20世紀前半期為主。
那麼,臺灣的報刊資料庫呢?若從日治時期來看,《臺灣日日新報》系統最受倚賴;戰後部分,當屬收錄聯合報系八種報紙的「全文報紙資料庫」,此二者是學界目前最常使用的電子系統。只是,後者雖曾於2010年獲頒數位出版金鼎獎「最佳電子資料庫」,不過由於「全文報紙資料庫」原先只有納入副刊文字,並非報紙原版呈現,有鑑於副刊長期扮演文學作品發表重要園地,且《聯合報》在臺灣文學史上自有角色介入與影響力,如鄉土文學論戰、兩大報文學獎等,對於想要透過數位資源鑽研戰後臺灣文學發展面目,特別是擬由場域研究入手者,無法掌握全貌,難免缺憾。可喜的是,聯合線上公司後來另闢蹊徑,專門設立「臺灣文學知識庫」,將《文訊》雜誌、《聯合文學》、《三六九小報》、《風月報》,以及眾人引頸期盼許久《聯合報》副刊原版也納入其中,因此格外令人振奮。關於這些資料庫,對於臺灣文學研究別具意義,筆者曾經撰寫〈新技術、新視野、新方法:《文訊》雜誌知識庫對於台灣文學研究的意義〉、〈「主義」退位,「資料」先行:台灣文學研究的新型態〉試加闡述,於此則專就《聯合報》副刊資料庫加以說明。
首先,就此次完成的《聯合副刊》電子資料庫而言,在2016年時曾經與「文訊雜誌知識庫」一起發行,但當時僅收錄2003年至2015年的《聯合副刊》,如今上溯1951年9月16日創刊號、下至當前,每日更新,使將近七十年數量的《聯合副刊》,得以完整數位典藏,讀者能夠逐日瀏覽PDF版。由於係原報版面重現,故不僅有利掌握副刊歷時性編輯面貌,且藉由各日版面,也可獲悉副刊篇幅長短演變與欄目設計安排概況。例如,目前所見《聯合副刊》乃在第D3版,擁有完整一頁篇幅,今回顧創刊號到1951年9月30日前副刊來看,當時文章刊在報紙第八版,約據半版而已。何以在一開始發刊時,不規劃更多版面?這可從創刊號〈綜合的.趣味的——《聯副》發刊告作者讀者〉文中知悉緣由。原來,此報是由全民、民族、經濟三家不同報紙聯合組成,為了顧及三報不同發言立場,以爭取容納更多新聞,因此副刊決定只闢一欄。僅存的一欄副刊,為求符合三報各自讀者口味,遂以「綜合、趣味」為編輯旨趣,希望有利集結三方優點。其次,針對這些經年累月發行的副刊,聯合線上公司進行數位典藏時,都有清楚標誌年份與日期,因此可以挑選特定日期予以瀏覽,例如從1951年開始,如果注意每年「五月四日」的副刊,便可知道「五四」文學記憶如何被紀念與發揚;聚焦「二二八」,則可一窺二二八文學何時才進入聯合副刊園地內;若關心「九月三日」副刊,則易見滿版都與軍中文藝有關。聰明的讀者,定可藉此展開特殊事件、歷史記憶、文學場域關係研究的歷時性考察。
而除了典藏作用之外,《聯副七十》電子資料庫還提供若干核心功能。例如「精選分類索引」,包括「小說」、「散文」、「詩」、「雜文」、「書評」,可輕易進行文類閱讀;或是經由「文學獎」項下,側見兩大報時期聯副獎項得獎人及其作品梗概,以及晚近與台積電公司文教基金會合作的台積電文學獎報導情況,乃至於「文學沙龍」項下舉辦樣貌。那麼,二者相較之後,多少能考掘出從聯副獎項到台積電文學獎之變化軌跡。當然,本資料庫最重要自是檢索功能,因為了解使用者經常輸入搜尋的是作家姓名或筆名,故還列有在聯副刊登較多次數的「典藏作家導航」一項,方便瀏覽各作家相關文章。其中,排名在前十名的作家們,包括:彭歌、薇薇夫人、金聖不嘆、司馬翎、華嚴、阮文達、丹墀、金庸等。這些人該是當時文壇的重量級人物,但何以目前臺灣文學史中多數未列於內?此一反差情形當如何思考?再者,因為作家姓名被清楚表列出來,也容易有意外收穫。例如筆者注意到「崔萬秋」此人,其在上海曾與在戰後初期一片魯迅風潮中,被視為反魯大將的曾今可打過筆戰,且是間接促成曾今可宣告退出文壇而前往日本遠避風頭的關鍵人物。未料到崔氏原來在聯副發表甚多文章,且常致力介紹日本文學和實際譯作,學界目前大多注意朱佩蘭、劉慕沙、黃玉燕,並未進一步探討崔萬秋的角色。
又,在「典藏作家導航」中發現不常見的名字,固然有助挖掘「始料未及」的問題;不過,輸入耳熟能詳的作家或作品名字,有時也能裨益新研究樂趣。例如以「聶華苓」為關鍵詞,可知〈桑青與桃紅〉連載未完;再以「李昂」進行搜尋,資料庫將提醒今年是《北港香爐人人插》出版二十五週年,但當年作品從1997年7月23日起至1997年7月26日,其實也只有刊登四回而已,則未選擇全文載完原因為何?副刊主編如何決定刊登全文或僅作節錄?從政治考量到主編判斷,研究副刊編輯學,這是值得一探的問題。而一旦能將碎片式的觀察所得賦予問題意識,自然可以感受到資料庫是可以提供建立「知識」的路徑,決不僅止於「資訊」消費而已。尤其,資料庫檢索尚有計量功能,讓數字說話,更能有新體會。即以「香港」一詞為例,以不設條件(精準查詢 / 全時間)方式搜尋,《聯副七十》資料庫計有11724筆,同屬「臺灣文學知識庫」的《聯合文學》共得2047筆、《文訊》1547筆、《自立晚報》562筆,若將之比對與合觀,可以匯集出香港文學在臺灣的傳播面貌,以及辨識報刊相互扮演角色是否有所差異?較常擔任引介香港文學者是誰?最早出現在臺灣的香港作家與作品為何?諸多攸關臺灣從事香港文學研究的探問,均可由此開始。過往臺灣文學學界多以「質性」研究為主,資料庫的利用,恰恰提醒「量化」研究的必要性。
欣聞《聯副七十》電子資料庫的發行,對於此份在華文世界舉足輕重報紙副刊的數位化,定然會為報刊學的文學研究帶來極大便利性;且這也是繼《臺灣日日新報》系統、《文訊知識庫》、《聯合文學》、《風月報》、《三六九小報》之後,臺灣文學數位資料庫的重要拼圖。而隨著資料庫日益增多,將資料庫當做臺灣文學研究新環境,甚至進行串連研究,相信不久就會躍居重要趨勢。
從臺灣文學報刊 見證時代風雲
2023 臺灣文學知識庫應用論壇
活動時間 | 2023.3.8(三) 9:00-17:00
活動地點 | 國立台北教育大學 篤行樓Y601國際會議廳
免費報名 | http://s.accupass.com/lGT1p4
「聯合副刊」線上閱讀-聯合副刊七十周年 璀璨文學花園收錄出刊迄今70年報版,盡覽重磅作家、詩人文學作品
⭐️點此購買
最新文章
-
對話司馬遷、打造專屬美妝顧問--中研院馬偉雲博士讓AI更接地氣
2024-11-14 -
微笑徜徉的夢想配備——兼論《臺灣詩學學刊》的典範形
2024-10-25 -
站在世紀之交的風口 --台灣詩學三刊物上線的時代意涵
2024-10-09 -
臺灣詩學庫 | 數位工具帶來詩學新視野
2024-09-23 -
從收音機、電視機到洗衣機 伴隨台灣家庭半世紀的聲寶與台灣三洋
2024-09-02 -
全面啟動語料研究的智慧引擎 – 國家教育研究院
2024-08-07 -
文獻寶塔:我與《聯合文學》知識庫
2024-08-02 -
請享受沒有蚊子的夏天! 蚊香為什麼都是螺旋型?
2024-06-24 -
台灣第一本閱讀指南《書評書目》:克服選擇障礙,在書海中找到知音作品
2024-05-23 -
副刊的前世今生 | 長篇小說連載的美好時光
2024-05-10 -
用文字談一場戀愛吧:《風月報》裡的曖昧筆尖
2024-04-25 -
只可意會,不可言傳?文宣廣告中的情慾世界
2024-04-22 -
靈魂最大的煎熬──5部戰爭電影介紹
2024-04-02 -
改善國民營養年代的補給品:健素糖
2024-04-01 -
《好讀周報》「補腦算算鍋」是教學好幫手!
2024-03-29 -
維繫知識戰鬥力–建構好讀資料 打敗閱讀偏食
2024-03-29 -
歌曲中雋永「聲」響!回味百年來火車歌謠中的聲與情
2024-03-25 -
文字手藝人──一位副刊主編的知見苦樂
2024-03-15