前言:本站為你精心整理了使用RSTTool分析科技英語長句范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
RST理論命名和定義了20多種關系,原則上來講,語篇關系的種類和數量是無限的,以前從未出現過的關系類型也可能在新的語篇關系中出現,但在實際應用中,用為數有限的關系就可以分析一種語言的大部分語篇,如大多數英語語篇都可以用20多種關系[3]來描寫。2001年,由DanielMarcu博士主持的研究小組以RST理論為支撐創立了語篇標注語料庫。其研究成果將定義關系擴展到了78種,包括53種單層核心關系和25種多層核心關系,并將這78中定義關系分成16個組別,每組都具有相同的修辭功能[4]。修辭關系有兩個主要的特點:(1)關系結構內部具有同質性。RST認為從小句連接到語篇,各個結構段之間是有層次的,兩個小句之間,幾個小句和幾個小句之間,再到段落與段落之間,直至整個語篇,都是有層次的。而且,層次的多少也是不固定的。關系結構同質性的特點,使得從小句連接到語篇本身的所有層級結構共用一套相同的關系模式,不會因為結構段的等級變化而不同,因此不同的分析者也會取得較高的一致性。(2)修辭關系的結構關系是功能關系,可用不同的效果類型來描寫,比如可從作者的交際意圖或作者對讀者情況的假定等角度來描述。結構段(span)是指語篇結構中任何具有RST結構的、功能完整的片段。兩個獨立的結構段根據其在相互關系中的核心或輔助地位,具體可分為“核心結構段”和“輔助結構段”,核心結構段可分為單核心結構和多核心結構。但多核心結構關系實際沒有核心與輔助之分,各部分是并列關系。結構段的劃分可以結合語篇中的邏輯關系采取自上而下,也可以自下而上或兩者兼用的方法。任何一個完整連貫而又符合邏輯的語篇都是由體現為小句、句子、語段、段落的結構段按一定的語義關系排列組成的,是動態的語義單位。結構段具有等級性的特點,因而結構段是相對于所在的功能整體來劃分的。RST關系可用認知圖示來說明各結構段之間的邏輯關系。Mann和Thompson[5]認為,認知圖式可決定一個語篇中所有成分的結構性排列。它由3個要素組成:一定數量的成分性結構段;結構段的關系說明;某個結構段(核心結構段)與語篇整體的關系說明。(1-n)代表結構段范圍;橫線及下面的數字,如1、2或者1、2、3、4、5代表具體的結構段;弧線代表結構段之間的關系,如“證據關系”、“序列關系”;在核心-輔助關系中,箭頭指向核心結構段,如“證據關系”指向結構段1;在非核心-輔助關系中,弧線不帶箭頭,如1、2、3、4、5之間的序列關系。
RSTTool
RSTTool是以修辭結構理論為理論框架,為語篇的修辭結構關系提供計算機分析的工具。該文本分析工具是澳大利亞人MickO’Donnell博士研制開發的,可以在Windows、Macintosh、Unix和LINUX多種操作系統下運行。其界面友好,可以對篇章結構進行切分和標示。其結構關系開放性的特點允許用戶修改、添加、刪除和重新命名等操作。其統計分析功能可以直接顯示各項百分比,從宏觀上把握各種篇章類型的特點,核心與輔助關系的次序也用數據顯示,這樣更方便讀者和譯者發現體現語篇要旨的核心篇位。其應用范圍廣,適用于多種語言分析。現在網絡上最常見的是RSTToolVersion3.45[6]。RST工具有四個操作頁面[7]:(1)文本界面(TextSegmentationInterface):用于結構成分切分。(2)文本結構關系界面(TextStructuringInterface):用于標示結構關系。(3)結構關系編輯界面(RelationEditor):用于編輯和維護結構關系。(4)數據統計界面(Statistics):用于統計分析數據。RSTTool的具體操作在下文中的實例分析中進行詳細闡述。
科技英語長句的RSTTool操作
科技英語(EnglishforScienceandTechnology,簡稱EST)敘述客觀、表達確切、流暢自然、邏輯嚴密,但其中長而復雜的句子,往往給閱讀和翻譯帶來很大的困擾。本節將概述科技英語長句的句法特點,運用RST工具進行實例分析,呈現該工具的操作方法。
科技英語長句的句法特點針對自然現象的實驗觀察、數據分析以及定理式的邏輯推理證明,科技英語具有技術性、抽象性、客觀性和信息高密度性的語域特征。從句法上看,科技英語組句較長,成分復雜,結構嚴謹。主要表現為:大量使用名詞、名詞短語、懸垂結構及分詞、不定式等非限定分句說明事理;頻繁使用介詞詞組和短語準確而簡練地實現時間、空間、目的、理由、因果等邏輯關系;表征目的、條件、因果等不同邏輯關系的從句交錯重疊;遵守英語句子末端重心原則,較長的分句移到句末,句子前后長度保持平衡。由此可見,科技英語的長句“長”在句子內部語義關系產生的多層次復雜性。目前,國內對于科技英語長句的研究與分析始終停留在詞匯、語法層面,描述科技英語長句的翻譯技巧,包括結構分析法、順譯法、倒譯法、中譯法、分譯法和綜合法,但沒有論述技巧背后的語義機制[8][9][10][11]。需要指出的是,楊堅定[12]運用修辭結構理論提出以修辭結構段作為動態翻譯單位,并對一段科技英語篇章原文和譯文的修辭關系對等進行了分析和解釋,這可看作是修辭結構理論應用于科技英語翻譯的成功嘗試。2.rsttool的操作展示下面以一個航空航天英語[13]句子為例,展示RSTTool的具體操作。BecauseShuttlesystemperformancerequiredahighlyefficientascentpropulsionsystem,anewrocketenginewasdeveloped—onethatwoulddeliversubstantiallyhigherperformancethanitspredecessors,couldbethrottledoverawidethrustrange,andcouldbeusedmanytimeswithoutmajormalfunctionoroverhaul.1)文本導入RSTTool只識別和處理文本文件(txt).,在導入一個新文件之前,應轉換為該格式。需要特別注意的是中文文本必須在保存和導入時選擇相同的編碼格式(英文文本默認的即可),例如文本格式保存時使用的是utf-8,那么在導入RST工具時,應在encoding處選擇utf-8。2)文本切分文本導入之后,進入文本界面(如圖),該界面有兩組操作命令,一組是Modes(方式),移動鼠標可以在文本切分和文本編輯之間轉換。另一組是Segment(切分),可以在句子和段落的處理之間轉換。其中Segment可以輸入標點,定義所要切分的位置。段落的切分是自動完成的,只要在“切分”(segment)狀態下,點擊段落切分,就出現段落標記符。RST工具只識別空行的段落,所以在輸入文本時,用戶要在段落之間做空行標記。句子的切分可以是自動完成,也可以是用戶手工完成的,因為有時候RST工具不能識別非常規的標點符號。一般情況下,在RST分析中,根據Mann&Thompson的應用實踐,分析單位的大小是任意決定的,但無論是大是小,這種單位必須具有獨立的功能完備性,據此獨立的短語、子句、句子都可以成為修辭結構的分析單位。在本文中,為了簡化操作和便于識別,筆者在導入之前就先把文本進行了編碼和切分。1BecauseShuttlesystemperformancerequiredahighlyefficientascentpropulsionsystem.2anewrocketenginewasdeveloped—.3Aonethatwoulddeliversubstantiallyhigherperformancethanitspredecessors.3Bcouldbethrottledoverawidethrustrange.3Candcouldbeusedmanytimeswithoutmajormal-functionoroverhaul.導入RSTTool之后,如下圖3所示。3)結構關系集的選擇和編輯在標示結構關系之前,要先進入關系(Relation)界面,導入(load)一個關系集,最常用的是第一個和第二個。第一個ClassicMT.rel是Mann&Thompson1998版,第二個ExtMT.rel是Mann&Thompson修訂的2000版[6]。在圖4這個界面,用戶可以增加、刪除或重命名關系。4)結構關系的標示結構關系的標示過程,是RST分析的重點和難點。在判定兩個結構段之間的關系時,分析者在每一步都要考慮關系定義運用的是否得當,要盡可能的做到客觀。點擊Structurer鍵,就會進入如圖5的界面。在標示單核心結構時,按下Link(連接)按鈕,從輔助結構段按住鼠標左鍵拖動到核心結構段,松開鼠標,出現結構關系菜單中的關系選項,選擇所要定義的關系,兩個結構段就被連接起來,在連接線上方標記為選中的結構關系。在標記多核心結構的時候,點擊AddMultiNuc按鈕,按照上述同樣的方法拖動鼠標,就會出現多核心結構關系的菜單,選擇所要定義的關系。然而,這只是第一步。多核心關系需要兩步操作,這時需要再次點擊Link按鈕的條件下進行選擇,在想要添加的結構段上按住鼠標左鍵拖到上一步出現的結構段上方的數字處松開,又會出現另外一個對話框(如圖7所示),然后選擇multinuc,多核心結構的關系定義即完成。Addspan的按鈕可以將核心結構段和所有的輔助結構段連接起來,操作也很簡單,點擊“addspan”,在核心結構段處點一下即可。標示完畢后,圖式可以儲存、打印或轉換顯示格式,也可以在結構菜單下,選擇將圖式粘貼到剪切板,使分析和闡釋更為方便和直觀。個結構段———新型火箭發動機的研制。本句包括三個結構段1、2和3,3又包括3A、3B、3C三個結構段。1和2是意愿性的原因關系,3B和3C是聯合關系,為3A的說法提供證據,因而3B、3C和3A是證據關系。3A、3B、3C都是對2的進一步闡述,是詳述關系。從句法的角度來看,3A和3B、3C之間是并列的,但從語義上來看,后者為前者提供了證據支持。
在科技英語篇章中,長句的出現頻率很高,如上所述,科技英語的長句“長”在句子內部語義關系產生的多層次復雜性。下面運用RSTTool3.45試析幾個長句內部的功能語義關系,尤其是隱性邏輯語義關系,從而展示理解和分析科技英語篇章的一種有效途徑。本節的航空航天英語例句也均選自嚴俊仁[13]。
例1:StimulatedandstrengthenedbytwoWorldWarsthebabyisgrowingupandthecommunityunderstandsveryfullythefoolishusesforwhichaircraftcanbeexploited—buttherearewiseusestoo,eventhoughtheymaynotbesoreadilyapparent.1AStimulatedandstrengthenedbytwoWorldWars1Bthebabyisgrowingup2andthecommunityunderstandsveryfullythefoolishusesforwhichaircraftcanbeexploited3Abuttherearewiseusestoo,3Beventhoughtheymaynotbesoreadilyapparent.從圖10所示關系圖解可以看出,該長句分為3個結構段。第一個結構段分為1A和1B兩個次結構段,它們之間的關系是隱性的非意愿原因關系;第三個結構段由3A和3B兩個次結構段構成,由于“eventhough”的存在,它們之間是顯性的讓步關系;結構段2和3之間是顯性的對比關系;1與2、3之間則構成了隱性的背景關系。結構段1和2由連詞“and”連接,似乎是并列的關系,但在語義上,結構段1為2提供了良好的背景知識,幫助讀者更好地理解結構段2的內容。
例2:Thisismadepossiblebythefactthatallthepilot’sinputsarefirstprocessedbyahighspeedcomputersystem;itthenpassesthemtotheaircraft’sflightcontrolsascommands,allowingATTAStoassumetheflightcharacteristicsofanotheractuallyexistentaircraftorofahypotheticalaircraft.1AThisismadepossiblebythefactthatallthepilot’sinputsarefirstprocessed1Bbyahighspeedcomputersystem;2itthenpassesthemtotheaircraft’sflightcontrolsascommands3allowingATTAStoassumetheflightcharacteristicsofanotheractuallyexistentaircraftorofahypotheticalaircraft.如圖11所示,此結構關系圖式分為3個結構段1A和1B之間是顯性的方式關系,由by表示;結構段1和2存在著明顯的序列關系,而作為核心結構段,結構段3是前2個結構段所要達到的目的。
例3:Therecanbenodoubtthatthesecond50yearsofpoweredflightholdsachallengemoreforbidding,thoughnolessinteresting,thanthefirstbutthesuccessachievedwillnotbemeasuredbymanlandingonthemoonbutbywhetherintheprocesswehavelearnedwisdomandindoingsohavestoredthefreeexchangeofknowledgewithinandbetweenallcommunitiesonthesurfaceoftheearth.1ATherecanbenodoubtthatthesecond50yearsofpoweredflightholdsachallengemoreforbidding…thanthefirst1Bthoughnolessinteresting,2Abutthesuccessachievedwillnotbemeasuredbymanlandingonthemoon2Bbutbywhetherintheprocesswehavelearnedwisdom2Candindoingsohavestoredthefreeexchangeofknowledgewithinandbetweenallcommunitiesonthesurfaceoftheearth.由該關系結構式(見圖12)可知,該句分兩個結構段。結構段1包括1A和1B兩個次結構段,其中1B在句子結構上屬于插入成分,二者之間是顯性的讓步關系;2B和2C是聯合關系,2A和2B、2C之間是對照關系,作者觀點是對后者的肯定;結構段1和結構段2之間是非意愿性原因關系,由于but的存在,看上去似乎是一種顯性的讓步關系,但是從深層語義來看,結構段1的出現使得結構段2中闡述的衡量成功的標準發生了變化,所以它們之間是隱性的非意愿性原因關系。
結語
修辭結構理論從動態交際功能的角度出發,擺脫了關聯詞語、語法結構、類型結構等表層語言形式的束縛,研究“目的”“、意義”等抽象體的結構關系模式,從而更清楚地呈現科技英語長句內部隱含的邏輯語義關系,更好地表達作者的交際意圖,有利于讀者更好地理解和把握文章主旨。上述實例分析表明,運用RSTTool標示科技英語長句各部分之間的關系,清晰、明了、易于理解,在很大程度上降低了理解的難度,為進行基于語料庫的RST科技語篇修辭結構標注和定量統計分析提供了有益啟示。
作者:董敏高文睿單位:北京航空航天大學外國語學院