前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇網絡新詞范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
[中圖分類號]H030
[文獻標識碼]A
[文章編號]1006-2831(2013)08-0171-3 doi:10.3969/j.issn.1006-2831.2013.03.043
1 . 引言
語言是社會生活的一面鏡子,反映了時代的變化,所以網絡用語也可以說是當前“網絡時代”的反映,與現代人緊張忙碌的生活節奏和生活觀念密切相關。隨著網絡的飛速發展,網絡用語有更加流行的趨勢,也越來越反映社會生活。網民的創造力是無窮的,在網絡的世界中,逐漸形成了自己特有的新詞。只有掌握了英語新詞的構詞規律,才能在網絡的世界里游刃有余。
2 . 網絡用語的產生及特點
美國學者布賴特(Pride:1964)在他的《社會語言學》一書中提出了“語言和社會結構共變” 理論。語言是隨著社會結構的變化而變化的,新的詞語的出現也是社會結構和生活變化的產物。網絡的普及對社會生活的各個方面產生深遠影響,從而使得網絡用語應運而生。
語言是反映社會的鏡子,網絡用語更是人們真實生活的一個反映。網絡用語有著很強的時效性,具有一定的風向標的作用。 網絡用語的自由性和多樣性折射著一個社會經濟發展的軌跡。它獨特新穎、新奇幽默、富于情趣和個性化使得網絡流行語具有了簡潔明了、易記易傳;便于理解和溝通、標新立異、反諷隱喻、富于張力的特點。網絡用語具有娛樂性,其傳播范圍之廣,速度之快,使得言論自由得到充分發揮,一定程度上也折射出社會情緒。
3 . 英語新詞的定義和語義特征
英語新詞的研究一直都是語言學家的興趣所在。對于英語新詞的定義,語言學家一直爭論不休。Bussman主編的Routledge Dictionary of Language and Linguistics對英語新詞作如下定義:Newly formed linguistic expression (word or phrase) that is recognized by at least part if not all of a language community as the way to denote a new object or state of affairs, be it in technology, industry, politics, culture or science(2000: 324). 英語新詞指的是某一段時期內或自某一個時間點以來首次出現的詞,往往是出于對新事物進行描寫的需要而出現的詞,也指詞典上還沒有收錄的詞,如很多詞典后面增補的詞語就是新詞(汪學磊,2008)。《韋氏新世界詞典》對新詞給出的定義為:(1)新詞語或已有詞語衍生出的新義;(2)新詞的創造及使用,舊詞新義的形成及使用(馮靜、臧哲慧,2012)。也許很難對新詞進行準確的界定。然而,新詞的定義可以從以下三種必需條件來描述:(1)該詞必須是最近出現的,一般來說,時間應限制在最近幾年或最近幾十年;(2)單詞必須被吸收入字典;(3)現有的詞添加了新的含義或其意義因為社會的發展,改變了其傳統意義。
英語新詞的產生是為了適應社會的發展,反映了社會經濟生活的變化,有以下四個語義特征:(1)新詞具有宣傳、多源、多意和語義變異的特點;(2)有變得更加流行的趨勢:英語新詞的數量劇增,來源多元化,有許多國家如英國、美國、澳大利亞、加拿大和新西蘭把英語作為他們的母語。印度和新加坡等國家把英語作為第二語言。英語是世界語言,全球各地都在學習英語,英語的使用范圍和影響力可見一斑。每個國家都為增加英語新詞做出了自己的貢獻。(3)英語新詞呈現系列化的趨勢。例如e- 就是指電子的,網絡的。e-shopping:網上購物;e-market:電子市場;e-cash:電子現金;e-revenue:電子商務收入;e-business:網上交易;e-service:電子服務等。(4)英語新詞變得越來越簡單。例如dbase:數據庫;online DJs:網絡音樂主持人;pgdn:page down(瀏覽網頁)下翻。
4 . 英語新詞產生的途徑
英語靈活多變的構詞方式為新詞創造提供了便利。大多數英語新詞并非是憑空生造出來的,而是將原有的詞或詞素以意義為中心進行重新組合,將近3/4的英語新詞是通過組合現有語言成分的方式構成的(楊彬,2008)。嚴格意義上講,詞的形成指詞的形成過程??梢赃M一步分為兩個次類:合成類和派生類。這是英語中最常見和構成能力最強的兩類。
4 . 1 合成詞
合成詞(compound)這個術語指那些由兩個或兩個以上的詞素構成的詞,或是指由兩個單獨的詞連接起來構成一個新的形式的構詞方法(胡壯麟,2007)。
我們從以下三個方面:拼寫,語音和語義來分析合成詞。
4.1.1 拼寫方面
拼寫方面,合成詞有三種拼寫方式:(1)固定式(可以寫成一個詞)cybernaut(信息空間旅行者,網迷)(2)(用連字符)連接式pop-up ad登陸某網頁自動彈出的廣告(3)分離式(兩部分間有一個空格)online galaxy:網絡一族。具體用哪一種沒有硬性要求,只是有些是約定俗成的,需要特殊對待,這與人的拼寫習慣有很大關系。
關鍵詞:網絡新詞新語 概念 來源 特點 翻譯方法
一、引言
語言是社會生活的一面鏡子,而新詞新語則是反映社會生活的放大鏡,顯微鏡。在新疆少數民族地區研究新詞新語能更好地發現民族語言規則、思維方式、生活習慣的異同。能更好地拉近民族的距離,讓他們能順利地交流,有助于新疆的民族團結。
二、網絡新詞新語概述
1. 概念
新詞新語,是一個相對概念,既包括某一時段新產生的詞語,也包括舊詞的新義和新用法;前一年出現過的后一年依然流行,并在不同的語境賦予新的意義,這都叫新詞新語。
2.來源
本文的新詞新語來源于國家語言資源監測語料庫。語料庫中的網絡新詞新語主要來源于論壇發帖、娛樂話題、新聞事件、微博、動漫、電視節目等。本文具體分析的語料是2015年媒體關注的十大榜單之首:我也是醉了。
3.特點
網絡新詞新語最大的特點就是時效性,因為它流行于某個時期、某個時段,而過了這個時期和時段,就有新的詞語替代它,所以它的“新”體現出時效性。其次是簡潔性,因為很多網絡新詞新語形式簡單,內涵豐富,是潮流和時尚的代名詞,要知道來源和典故,并置于具體的語境才能看出,這也是人們喜歡使用的很重要的原因之一。再者是它的口語性,因為多使用口語的表達方式,不遵從嚴謹的書面語,打破固定的語法規則,這也是詞匯語言學的重要研究課題之一。最后就是它的傳播性,因為前幾種的特點,它在不同地區、階層、年齡段之間傳播的十分迅速,這也是網絡新詞新語廣泛用于社會生活,讓人們進行交流的重要因素。
三、翻譯方法探究
在以往的研究中我們發現網絡新詞新語的分布規律大致是:年輕群體大于年長群體,城鎮群體大于農村群體。在撰寫本文的同時,筆者也對本校民族學生使用網絡新詞新語的情況進行了調查。調查得出:漢族學生使用頻率大于維族學生,低年級的學生使用頻率大于高年級的學生,學生的使用頻率大于老師的使用頻率。
探討翻譯網絡新詞新語的方法。本文以2015媒體關注的十大榜單之首:“我也是醉了” 為例進行分析。在維吾爾族人的認知中,這句話只有兩種意思:一是指真的喝醉酒了,翻譯為haraq it∫ip mεs bolu∫;二是指為之陶醉,欣賞,翻譯為mεstxu∫ bolu∫。而現在我們常用的卻有以下三種意思:
1.假借醉了、不清醒的狀態來表示不能理解對方的想法,實則表達對對方的不可理喻而表現出的不滿。
(1)哥:“他說我不照顧孩子,好吧我也是醉了?!盿ka:u meni balia qarimajdu dedi,boptu mεndimu amal joq.
本句的翻譯方法為意譯法,翻譯技巧為轉換法。將“醉了”譯為“amal joq”。
(2)四娘:“韓爺為何最近不來,難道說爺又醉了嗎?”tθtint∫i a?t∫a εrkilεp turup :xεn begim jeqindin beri nemi∫qa kεlmεjdu,εd?ba begim kili∫ni xalimamdu?
本句的翻譯方法為意譯法,翻譯技巧為轉換法。將“醉了”譯為“εd?ba begim kili∫ni xalimamdu”。
2.表現對事物、狀態、行為的無力感,進而表達出一種無奈、無法交流的心理感受。
(1)她穿著比基尼那也叫艷照?看來我也真是醉了。uni? bikini kiji∫mu rε?lik syrεt bolsa,buni??a mεn rastinla amalsizimεn。
本句的翻譯方法為意譯法,翻譯技巧為轉換法。將“醉了”譯為“amalsizimεn”。
(2)我跟你辯論一個身高一米四的、不男不女的、思想骯臟的小個子的人這么久,我也真的是醉了。Boji bir metir qiriq kelidi?an ,idijisi paskina,rεzil qizmu εmεs,o?ulmu εmεs bir adεm,meni? sεn bilεn ∫unt∫ε uzun tirkε∫kinimni kimmu ojlisun,mεn rastinla θzumgε“qol qojdum”。
本句的翻譯方法為意譯法,翻譯技巧為轉換法。將“醉了”譯為“qol qojdum”。
3.對人物或事物的輕蔑和鄙視,表達出不屑于對其進行回應和反擊。
(1)他拍的那也叫電影?我也真是醉了。Uni? i∫ligimu kino bolamdu?boldi mεn uni? bilεn tala∫majmεn。
本句的翻譯方法為意譯法,翻譯技巧為引申法。將“醉了”譯為“mεn uni? bilεn tala∫majmεn”。
(2)她的臉太美太耀眼,我想我也是真的醉了。uni? t∫iraji nahajiti t∫irajliq hεm d?εlip qilarliq,biraq mεn undaq dεp qarimajmεn。
本句的翻譯方法為意譯法,翻譯技巧為引申法。將“醉了”譯為“qarimajmεn”。
上述所例舉的例子翻譯成維語時采用了意譯法,翻譯技巧有轉換法和引申法。因為維語中沒有對應的詞語和句子,通過對句子上下文和語境的體會,將原文換一種說法進行表達,以便讀者能夠理解。除此之外2015年媒體關注的網絡新詞新語的十大榜單還有:“有錢就是任性、主要看氣質、這是什么鬼、cp、小鮮肉、腦洞大開、土豪、買買買、約嗎。”如果不是時代賦予了網絡新詞新語另外的含義,如果不是了解網絡流行語言的人,用這樣的話語去和維吾爾族交流,肯定會產生語言障礙甚至是笑話和矛盾。因為民族有著不同的生活習慣、思維方式、語言藝術,沒有辦法去用具有強烈時代色彩的詞句進行交流和溝通。網絡新詞新語是我們生活的一部分,而且作為年輕、走在潮流前沿的一代,使用網絡新詞新語成為了必然,所以為了盡可能消除民族的交流障礙,我們要努力探討出適合網絡新詞新語的翻譯方法。在翻譯中因為網絡新詞新語具有實時性、時代性等特點,翻譯起來十分困難,所以許多從事翻譯的工作者也不愿多去涉獵。但是雖然它不規范,卻是老百姓最常用、最反映社會現實和人民生活需求的語言載體。而且解決網絡新詞新語的翻譯問題,不光是對民族有益,更是對解決青少年和中老年人群的“代溝”問題有重要作用。在進行翻譯工作時,要讓翻譯者了解這些詞句本身的語法規則,結合具體語境,聯系使用現狀,找出對應的詞句。翻譯時具體要注意以下幾點:1.盡量避免對號入座式的翻譯,注意選擇合適的翻譯方法如意譯法和等值互借法等;2.翻譯時要注意其生動性和藝術性,不但要忠于原意,而且還能結合這些新詞新語的音、形、意以及具體語境等幾個方面表現出來的突出特征使譯文盡量做到生動活潑,富有藝術性;3.網絡新詞新語的翻譯都是在交際過程中為了應付某個場合即時翻譯的,沒有經過深思熟慮,這些翻譯會出現些許的偏離,還有就是隨著時間的變化,新詞新語的內涵隨時發生變化,所以翻譯時要結合當時的特點,及時修正過去譯文中的不妥之處,重新探索新的適合的翻譯方法;4.對于政治色彩濃厚的網絡新詞新語要盡量尊重已有的習慣譯法,這樣可以避免理解上的混亂,而且要有政治的高度和素養,以嚴謹的態度對待;5.以不同的文化視角做到靈活翻譯。網絡新詞新語來源于政治、經濟、文化、生活。對于來源不同的新詞新語要采用不同的翻譯方法,尤其要區分來自本民族和外來語的兩種新詞新語的翻譯,要以不同的文化角度、思維習慣和生活方式來靈活翻譯這些網絡新詞新語,對外來詞的翻譯一定要根據其來源地的文化背景和語言習慣、語法規則來翻譯。
由于語言經濟的原則,越來越多的人使用網絡新詞新語,簡潔固然是網絡新詞的優點,但我們一定要區分現實和網絡生活,如果在日常的書本上或語言中不分清語境、不理解語義就盲目使用這些文字,不僅使漢字亂了套,也會對雙語學習者造成一些不必要的困擾。為了讓民族融洽和諧的交流,為了將幽默、愉快、時尚的生活方式運用到生活中,理解并熟練運用網絡新詞是走上新時代的必經之路。
在這個信息技術迅猛發展的時代,互聯網已成為了人們生活當中必不可少的一部分,與此同時它也衍生出了許多豐富多彩的網絡文化,特別是一些獨特個性的網絡語言和網絡詞匯。這些網絡新詞代表著當代年輕人的一種生活方式,它直接折射出了社會上的某一現象或時代特征。因此為了更加有效的做好對外宣傳工作,譯者需要充分了解網絡新詞的相關背景,從而準確的將網絡新詞進行翻譯。
網絡新詞形成的原因及其特點
隨著科學的發展和歷史的進步,我們生活的方方面面都在不斷的發生變化,互聯網如今成為了人們生活當中重要的組成部分,人們在網絡的平臺上進行交流,當一個新詞出現時,便會以極快的速度傳播到各處。在這樣的背景下,許多新的網絡詞語應運而生,很快被大家發現并加以利用。互聯網是一個思想相對開放的地方,任何人都可以借助網絡進行創作,這就大大激發了民眾的創作熱情,使得一大批詼諧幽默,形象生動的網絡新詞涌現了出來。與此同時,為了迎合觀眾的需求,許多影視作品也會力求新鮮而產生各種新詞,尤其是在每年的春晚之后就會誕生一些有特色的新詞,這些詞匯一旦得到網友的熱捧,就會立刻得到廣泛關注。
網絡新詞所代表的是當下時代的文化和精神,它反映了社會的熱點話題,因此它所表達的內容往往新穎獨特。例如“房奴(mortgage slave)”,“被就業(to be alleged to have found jobs)”以及“酒后代駕(designated driver)”等就都反映了當今社會的生活態度。互聯網為民眾提供了一個充分發揮想象力和創造力的自由空間,這就使得網絡上的新詞常常既生動幽默又富有內涵。拿“打醬油(none of my business)”這個詞為例子,傳統意義上對這個詞的解釋為自己拿著瓶子到商店里買醬油,而在網絡上談到與自己無關的話題時,就可以用此話回帖,相當于在告訴別人你只是一個路人,一切事情與你無關。所以譯者在進行翻譯時,一定要準確的把握源語的意圖,有效的運用各種翻譯技巧,從而使目的語讀者能夠充分的了解這些網絡新詞的涵義和特點。
網絡新詞的翻譯方法
為了更好向外界反映中國社會現階段的變化與發展,對外宣傳的翻譯工作就顯得極其重要,特別是新詞的翻譯更是占著舉足輕重的地位。網絡新詞的出現,極大的豐富了語言的表現力,它反映著當今時代的熱門話題及時代精神。因此在翻譯過程中,最重要的就是要形象的向目的語讀者傳達源語的信息及內在意義。
翻譯時,譯者可逐字將譯文與原文進行對照翻譯,這樣既保持了形式的一致,又將源語的意義完整的呈現給了目的語讀者。例如“剩女”就譯為了“old spinster”,“剩女”在中文中指的是一群在婚姻上得不到理想歸宿的大齡女青年,而“spinster”這個詞就恰恰有老姑娘的意思。還有“團購(group buying)”,“麥霸(Mic king)”“人肉搜索(human flesh research)”以及“鉆石王老五(diamond bachelor)”也都使用了這樣的翻譯技巧。在網絡新詞翻譯中,這樣的翻譯方法數不勝數,但有時也會出現無法逐字翻譯的現象,比如“二奶(kept woman)”就不能被譯為“second milk”,這樣的翻譯只會讓外國人看著一頭霧水,因此在翻譯過程中譯者要學會根據具體情況靈活的變換翻譯策略。
翻譯的首要目的就是用另一種語言準確的再現源語的信息,當逐字翻譯無法將源語的意義再現出來時,譯者就可以運用意譯的方法進行翻譯,也就是說譯者不需要拘泥于源語的表達形式和句法結構,而只要按照符合譯入語表達習慣的形式把源語的意義表現出來即可。例如“神馬都是浮云”就被譯為了“all is vanity”,原句中的“神馬”是“什么”的諧音,這句話的意思是說什么都不值得一提,什么都無所謂。因此譯者在面對此類翻譯時,就需要先理解源語的意義,然后再按照其想表達的意思進行翻譯。這樣的翻譯方法既能夠幫助目的語讀者輕松的理解源語信息,又減少了由于文化差異所造成的誤解。
由于文化差異的存在,翻譯時難免會遇到語言空缺的現象,尤其是一些網絡新詞,這些詞語有時來自于網民的自由創作,因此他們在詞匯和語法上并不是完全按照正常的思維進行組詞,這樣一來譯者在翻譯過程中就很難找到與之相對應的翻譯。在這種情況下譯者就可以進行創造性翻譯。例如“給力”這個詞就可以譯為“gelivable”,相對應的“不給力”就能譯為“ungelivable”。其實在以往的翻譯過程中也經常有創譯的存在,如“好久不見”就逐漸被人們譯為了“long time no see”,雖然其在語法上是錯誤的,但經過長期的應用,也逐漸被人們所接受。
總結
摘要:本文主要以網絡新詞“給力”為考察對象,試從它的產生,用法及英譯角度分析該詞,以探求該詞對未來中英新詞發展的啟示和導向作用。
關鍵詞:網絡新詞 給力
一、給力的產生
用百度關鍵詞檢索“給力”的使用條目,已達402 萬條。檢索“太給力了”,網頁篇目有18 萬篇,“很給力”有90.6 萬篇,“不給力”有194 萬篇。可見,“給力”已經成為一個網絡流行詞。 “給力”一詞甚至還登上2010 年11 月10 日《人民日報》頭版頭條新聞標題――《江蘇給力“文化強省”》。但“給力”一詞的出處,卻眾說紛紜,莫衷一是。
暨南大學黃珊珊(2010)提到,“給力”本是東北方言詞,但平時很少被用到。相反,意思與其不相上下的“給勁(兒)”更為常見。由吉林文史出版社出版的《東北方言詞典》就收錄了“給勁”而沒有收錄“給力”,該詞典只收錄了一個意思,即“使勁,起(好)作用”。搜索北大CCL 現代漢語語料庫,我們會發現,里面沒有含 “給力”的條例,而“給勁”(包括“給勁兒”)有8 個。
也有說“給力”一詞是從閩南話演變過來的。在閩南漳州話中,“給”的讀音和“自給自足”里的“給”讀音相同,讀作[kik] ,不是讀為普通話的“gěi ”,“力”也不是讀為“lì”,“給力”的閩南話是“激力”,讀為 [kik-làt] 。閩南話的“莫”讀為[bok],表示否定的意思。閩南漳州話“莫激力”意思為沒有使勁?!安唤o力”即由“激力”、“莫激力”轉變而來的,來自于閩南話,說更早點則是來自古中原的河洛話,非新詞。
但據我們查閱的《漢語方言大詞典》及相關方言資料發現, 這類詞典工具書里畢竟并未收錄“ 給力” 這個詞。所以正如北京語言大學漢語學院的崔健教授所說:“‘給力’ 一詞在中國北方和南方的語言體系中都沒有‘背景’。”(程金玲2011)
鄭欣榮2010年12月18日在《長江日報》頭版報道中南財經政法大學新聞與文化傳播學院講師高海波博士的一項發現,據高博士考證,“給力”是中國古代官府給官員支付薪酬的一種方式,即以力役的形式向官員支付薪俸。具體而言,就是朝廷根據官員的等級,撥給數量不等的勞役,為官員免費耕種田地或提供家政服務。在劉國新編撰的由中國社會出版社出版的《中國政治制度辭典》(1990年版)中,就有“職官給力制度”詞條。高博士介紹說,秦漢以來,歷代朝廷都制定法律規定,百姓除納糧外,成年男子必須為朝廷服力役和兵役。服力役的百姓,有“力”、“事力”、“吏力”、“力人”等不同叫法。所以朝廷向官員供給勞役就叫做“給力”。
無論是方言借鑒一說,還是復古一說,網絡的作用都不容忽視?!敖o力”被頻繁使用和迅速傳播主要源于網絡上一個名叫 “cucn201”的配音組合。這個組合的四個成員都是中國傳媒大學06級的本科生。今年六月份的時候,他們將《搞笑漫畫日和》(日本漫畫家曾田幸助于2002 年創作的漫畫)中的六集進行了中文配音。在這六集的視頻中,有一個場景是這樣的:師徒三人終于到達天竺,卻發現所謂天竺只有面小旗子,上書“天竺”二字。悟空大呼:“不給力啊!”自此,“不給力”不脛而走。由于深受廣大青年網民認可和喜愛,被越來越多的人模仿使用。
二、給力的用法及英譯
2.1給力的用法
給力既可以作動詞用,也可以作形容詞用。作為動詞使用時一般為動賓短語,相當于給予力量。“不給力”就是它的字面本意,形容和自己預想的目標相差甚遠。而“給力”自然就是有幫助,有作用,給面子的意思了。比如:西安市韋郭路上宣傳牌上“乘勢 破題 給力 提速 崛起 實施追趕戰略 謀求跨越發展 ――西安市長安區政府宣
作為形容詞,意思類似于 “很好”、“牛”、“很帶勁”、“酷”、“棒”、“很有意思”等。常作感嘆詞。另外,在實際使用中也可加一個否定前綴,如“不給力”,表示某個事件或某個人帶給自己一種很失望的感覺。例如,今年春晚,繼小品《美好時代》之后,朱軍問大家“剛才的小品給力嗎?"臺下一片歡呼。
2.2給力的英譯
隨著給力的日益流行,它已經被別出心裁的網友造出一個新的英文單詞――ungelivable(不給力)。現在已經被有道,金山詞霸等網絡詞典收錄?!皍n-”在英語中表示否定,可翻譯為“不”;“geli”為“給力”的漢語拼音音譯,后綴“-able”在英語中表示單詞為形容詞。這一英文新詞充分體現了中西合璧的造詞邏輯。從ungelivable到gelivable,美國《紐約時報》如此定義“給力”:該詞字面意義為“giving power(給予力量)”,中國網友把它當形容詞用,表達“cool(酷)、awesome(真棒)、exciting(爽)”等意思。國外的網絡詞典給了如下定義:
Gelivable adj. A Chinglish word, be able to excite, make someone feel cheerful. ge- in Chinese means give, li- means power, strength or energy.(形容詞。中國式英語,使人興奮的意思,“ge”是中文“給”的意思,“li”是力量、能量。)
Ungelivable adj.Coined by the Chinese internet users recently to describe the feeling that something is not as good as expected and not giving you the "YES! THIS IS IT!" moment. ( 形容詞。中國網民造的詞語,用來描述事情并不像期待那樣好。)
2.3英譯的形成
根據語言學家的總結,英語新詞的形成方式主要包括:傳統的六種構詞法“復合法,縮略法,拼綴法,派生法,轉化法,逆成法”;舊詞獲得新意;類推法;外來詞的借用等。(何艷群,2008)不同于以往構詞方式的是,“gelivable” 前半部分是純粹的音譯“geli”,后半部分則為典型的英語后綴“-able”,用英語中慣用的這一后綴表示該詞的形容詞詞性, 中間因為音節需要加一輔音字母“v”,像“unbelievable”一樣,讀起來來朗朗上口,十足一個地道的英文單詞,就連以英語為母語的外國朋友也不僅感嘆一番。
2.4英譯的局限性
可見,給力的英譯主要是以其作為形容詞來界定該詞詞性的。類似于漢語中一詞多性的特點,雖然英語中也不乏這樣的形容詞動用,比如, articulate 首先作形容詞表示“分明的,可聽懂的”,作為動詞表示“闡明”。但對于“gelivable”而言,這個帶有典型形容詞后綴“-able”的英譯很難被以英語為母語的人們當做動詞來用,顯而易見,給力作為動詞的漢語意思在該英譯中丟失貽盡了。
三、總 結
類似于世界語,ungelivable和gelivable吸收了兩個語系共同性的合理因素,更加簡約和中性。該英譯一方面顯示了語言作為文化傳播媒介的創新多變,另一方面也密切了中英文化的關聯。通過以上對“給力”的產生,用法,及英譯的分析討論,筆者認為“給力”一詞必會相當給力地給縮短兩種語言之間的差距,為更多漢英通用的新詞匯的出現打開一扇新的窗口。
參考文獻:
[1]程金玲. 給力 “給力”[J]. 十堰職業技術學院學報 2011.2
[2]何艷群. 英語新詞產生的社會背景及主要形成方式 [J]. 浙江萬里學院學報 2008.1
[3]馬思周, 姜光輝. 東北方言詞典[M]. 長春:吉林文史出版社,1991.
[4]黃珊珊. 小議流行詞“給力” [J]. 電影評界,2010.
[5]徐寶華,宮田一郎.漢語方言大詞典[K] .中華書局, 1999.
關鍵詞 網絡新詞 質子串分解 互信息 F-MI
中圖分類號:TP391.1 文獻標識碼:A
0引言
新詞是未登錄詞的一種,即新詞也是未收入在詞典中的詞,但它和未登錄詞還是有所不同。它指通過各種途徑產生的、具有基本詞匯所沒有的新形式、新意義或新用法的詞語或者是出現在某一時間段內或自某一時間點以來所首次出現的具有新詞形,新詞義或者新用法的詞匯。
1新詞獲取系統流程
新詞識別的信息流采集于門戶網站下載的網頁,組建語料庫,對語料進行預處理,建立Pat Tree索引 ,然后進行術語抽取。其中術語抽取的方法采用基于卡方檢驗的質子串分解方法。
2網絡新詞識別方法
該模塊是系統的核心模塊。首先,對候選術語集合進行C-value參數計算,對于C-value小于給定閾值的候選術語將被從列表中刪除;然后對表中的候選術語進行字符串分解,并根據分解結果計算所有候選串的F-MI參數值;最后,根據給定的F-MI閾值,淘汰掉錯誤的候選術語,并輸出最終的術語列表。
2.1質子串分解
我們把詞簡單地分為兩類,一類是不可再分解為更小的詞匯單元的詞匯,這類詞我們稱為質詞,如“珠穆朗瑪”一詞,任何子串(“珠穆朗”或“朗瑪”等)都不是詞;另一類是由質詞組合而成的詞匯,這類詞我們稱為合詞,如“社會保障體系”則是由三個質詞(“社會”、“保障”和“體系”)組合而成的。對于串S,除了單字串和質串以外,都是合串,單字既不是質串,也不是合串。對于合串S,如果S可以串分解為S= S1 S2 S3…Sm,其中Si可以為質串或單字,但必須至少有一個是質串,則稱S=S1 S2 S3…S m是S的一種質子串分解。
2.2串分解的F-MI
本文采用改進的互信息參數F-MI來評估一個串成為術語的可能性。參數F-MI的定義分兩種:串分解的F-MI值和串的F-MI值,其中串的F-MI值的定義以串分解的F-MI為基礎。
對于串S及S的一種分解S= S1 S2 S3…Sm,串分解的F-MI的計算公式為:
S表示待計算的串,F(S)表示S在文檔集中出現的次數,T(S)表示S所有父串在文檔集中出現的次數,而C(S)表示S所有父串的個數。
參數C-value的目標是為了提高網狀術語的抽取效果。由公式3.2可知,對于極大串S,C-value(S)=F(S);而對于非極大串S,C-value參數則綜合考慮了S及其所有父串之間的網狀關系,例如對于極大串S1=“珠穆朗瑪”及其子串S2=“珠穆朗”,如果F(S1)=F(S2),則C-value(S1)=F(S1),而C-value(S2)=0。
而參數的定義為:
其中,i表示表中的行變量,j表示列變量,Oi,j表示表單元(i,j)的觀測值,Ei,j表示期望值。這里,我們取2康謀砝醇撲悖綾所示。
表2 單詞質量和監督出現次數之間的依賴關系的2康謀
檢驗從理論上講適用于各種大小的表,但是對于2康謀淼謀澩鐨問較嘍約虻ィ
=(N是語料庫中二元對的總數)
2.3串的F-MI
對某一質串S= C1 C2 C3… Cm(其中Ci均為單字),質串F-MI的計算公式為:
其中,本文定義單字的C-value(C)=F(C),如質串“珠穆朗瑪”的F-MI值為:
而對某一合串S,如果S的所有質子串分解為:
即共有n種分解方式,根據公式3.1,分別計算每一種串分解的F-MI值(f1,f2,f3,…,fn),則合串S的F-MI的定義為:
F-MI(S)=Max(f1,f2,f3,…,fn) (3.5)
本文術語抽取的重點是合串的抽取。而在抽取到的62190個合串中,只有4531個被Hownet收錄,92%以上的合串未被收錄,其原因是這些合串大部分并不屬于嚴格意義上的詞,而主要是一些短語和組合術語。另外,本文結合卡方檢驗對組合術語出現的偶然性進行驗證,從而使合串抽取的正確率有所提高。
3實驗結果及分析
(1)測試數據
我們下載了新浪(http://.cn)網站上從2013年1月到2013年6月的文章,共計130016篇文章,約345M。
(2)測試結果及評估
本次實驗共抽取到了241998個術語,其(下轉第45頁)(上接第43頁)中108102個被Hownet收錄,占所有抽取總數的 44.67%,質串99040個(91.62%),合串9062個(8.38%);詞典之外(OOV)的133896個術語中,質串18578個(占13.87%),合串115318個(占86.13%)。當我們對詞典之外的進行了人工評估,并規定,在合串中只有名詞性短語才被認定為是正確的詞匯。正確的詞匯共有204696個,總體準確率為85.41%。
(3)實驗結果分析
本文網絡新詞抽取的重點是合串的抽取。而在抽取到的124380個合串中,只有9062個被Hownet收錄,90%以上的合串未被收錄,其原因是這些合串大部分主要是一些短語和組合術語,并不屬于嚴格意義上的詞。另外,本文采用結合卡方檢驗和互信息F-MI檢測對組合術語出現的偶然性進行驗證,從而使合串抽取的正確率有所提高(表3、表4)。
我們通過計算抽取到的術語數目與語料規模的比值來考察分析。與文獻(Patrick & Dekang 2001)10M測試語料抽取到10268個術語相比(比值約1026.8),本文在約345M的測試語料上抽取到241998個術語(比值約876.8),該參數要小于前者,隨著測試語料規模的增大,重復術語出現增多,所以在結果上基本是一致的。
4結語
本文介紹了基于卡方檢驗和質子串分解來獲取網絡新詞,今后我們將針對參數F-MI的特點,繼續對F-MI公式進行研究和改進,以提高質串的抽取效果;在今后會根據詞法規則來自動過濾非名詞的詞匯。在本文提出的方法和實驗結果的分析的基礎上,我們將嘗試結合自然語言處理中的文本自動分類技術,基本上自動實時動態地從Internet上抓取網頁,并自動分類,對不同類別的文本集分別進行術語抽取,建立一個實時的動態的網絡新詞發現系統。
參考文獻
[1] Frantzi K, Ananiadou S. Extracting Nested Collocations[c]. Copenhagen Denmark:Proceeding of COLING,1996:41-46.
[2] Patrick Pantel,Dekang Lin. A Statistical Corpus-Based Term Extractor[c]. Canada:Canadian Conference on AI,2001:36-46.