學術寫作應該如何使用語料庫

寫作資訊,文法與單字選用

英文論文的寫作者對線上詞典和翻譯軟體都比較熟悉,但是很多人對語料庫是比較陌生的。 它是一種未被充分利用的能夠幫助學術寫作的寶貴資源。 這篇文章簡要介紹線上英語語料庫對於學術寫作的作用。

 

 

什麼是語料庫

語料庫(corpus,複數corpora)是指經過科學取樣而形成的電子文本庫,存放實際使用中真實出現過的語言材料。 語料庫一般用於詞典編纂、語言教學和傳統語言研究等領域。 語料庫分為很多種,例如英國國家語料庫(BNC)、美國當代英語語料庫(COCA)、密西根大學學術英語口語語料庫(MICASE)、中文文本分類語料庫等。 語料庫具有動態性,即語料是不斷動態補充的,可以追蹤到語言成分的產生、成長和消亡。 隨著各領域用詞的流通應用和變化,語料庫的容量、選材和抽樣也都隨之變化。

語料庫需要並能夠與線上詞典、翻譯軟體和電子期刊庫在幫助學術寫作方面實現互補。 詞典的作用是解釋單詞含義和語法規則。 翻譯軟體能粗略翻譯出句子結構與用詞。 電子期刊庫能夠通過標題、摘要或全文給出英文專業術語及其用法示例。 語料庫則具有以下五個重要作用。

 

語料庫的功用

  • 對不確定的英文細節進行修訂

例如,如果在美國當代英語語料庫里搜索某詞,比如「puton」和「putoff」,通常能夠看到上百條實際應用的語料。 這些各種用法的示例一目了然,比詞典在語言運用方面所能提供的資訊豐富得多。

  • 能夠提供單詞的同義詞清單和應用示例,使得寫作用詞能夠變得豐富。
  • 能夠提供比詞典更新得更快更頻繁的最新學術用詞及用法示例。
  • 提供美式英語和英式英語之間的差異和用法示例。

例如,在美國楊百翰大學語料庫網站有美國英語和英國英語語料庫的連結,使用者可以搜索和比較在這兩種風格中使用的術語或短語。 例如,美式英語喜歡用「inthe hospital」,而英式英語喜歡用「in hospital」。 這種實際用法上的差異往往是詞典、語法書中的理論和翻譯軟體所無法揭示的。 需要注意的是,語料庫通常不會解釋什麼是正確的、什麼是錯誤的。 它只是提供現實世界中常用的用法。

  • 校驗翻譯器的譯文是否正確

在複雜的語境下,即使一些常用的詞彙也可能被翻譯器譯錯。 英文學術寫作的主要困難是把握專業術語和生詞,以及一些詞彙在特定語境下的特殊含義。 要想在細節上準確把握這些詞語的用法,以及判斷翻譯器給出的譯文是否正確,就需要使用語料庫。 例如,中文的”結婚權”可以被翻譯為”right to marriage”。 對於這種組合詞,查詞典有可能查不到,而不同的翻譯器則可能會給出多種譯法,包括「matrimonial right」。 這時,我們需要判斷”matrimonial right”究竟是表示結婚權,還是表示婚姻中的權利。 為了解決這種疑問,可以去語料庫檢索,甚至包括輸入”matrimonial right*”這種帶星號”*”的詞。 星號代表「right」後可能出現的任意字元。 通過對語料庫中最接近所譯材料語境的文本例句分析,可以確認翻譯器把”結婚權”翻譯成”matrimonial right”是錯誤的。

 

常見語料庫

  • 美國當代英語語料庫(COCA):該語料庫免費供人們線上使用,是一個珍貴的英語學習寶庫,也是觀察美國英語使用和變化的一個絕佳視窗。
  • 英國國家語料庫(BNC):該語料庫由牛津出版社、朗文出版公司和大英圖書館等機構共同建立,總詞量超過1億,其中書面語約佔90%,口語約佔10%。
  • 楊百翰大學語料庫(BYU corpus):由美國楊百翰大學語言學教授創建,整合了美國當代英語語料庫、美國歷史英語語料庫、美國時代雜誌語料庫、英國國家語料庫、西班牙文料庫、葡萄牙語料庫等六個語料庫的資源。 該網站每月大約有六萬人使用,或許是目前最為廣泛使用的線上語料庫。
  • 英語整合語料庫(Corpus Concordance English):該語料庫包括學術、法律、電視節目、歷屆美國總統演講等內容,詞量達高數千萬,包括口語和書面語兩種形式。
  • 密西根大學學術英語口語語料庫(Michigan Corpus of Academic Spoken English):該語料庫由美國密歇根大學英語語言研究所建立,內容主要為學術英語口語,詞量高達184萬。

 

在你進行學術寫作時,不要忘記語料庫這個能夠為你的翻譯品質把關的強大工具!

Leave a Reply

Be the First to Comment!

Notify of

wpDiscuz