前言:在撰寫采集技術(shù)論文的過程中,我們可以學(xué)習(xí)和借鑒他人的優(yōu)秀作品,小編整理了5篇優(yōu)秀范文,希望能夠?yàn)槟膶懽魈峁﹨⒖己徒梃b。
1.目的
(1)培養(yǎng)學(xué)生綜合運(yùn)用所學(xué)知識(shí),結(jié)合實(shí)際獨(dú)立完成課題的工作能力.
(2)對(duì)學(xué)生的知識(shí)面,掌握知識(shí)的深度,運(yùn)用理論結(jié)合實(shí)際去處理問題的能力,實(shí)驗(yàn)?zāi)芰?外語水平,計(jì)算機(jī)運(yùn)用水平,書面及口頭表達(dá)能力進(jìn)行考核.
2.要求
(1)要求一定要有結(jié)合實(shí)際的某項(xiàng)具體項(xiàng)目的設(shè)計(jì)或?qū)δ尘唧w課題進(jìn)行有獨(dú)立見解的論證,并要求技術(shù)含量較高.
(2)設(shè)計(jì)或論文應(yīng)該在教學(xué)計(jì)劃所規(guī)定的時(shí)限內(nèi)完成.
一、論文(設(shè)計(jì))選題來源
1:長春廣播電視大學(xué)畢業(yè)設(shè)計(jì)題目.
2:吉林省森工集團(tuán)信息化發(fā)展前景與規(guī)劃.
3:吉林省林業(yè)設(shè)計(jì)院網(wǎng)絡(luò)中心網(wǎng)絡(luò)改造與發(fā)展規(guī)劃.
4:吉林省林業(yè)系統(tǒng)生態(tài)信息高速公路構(gòu)建課題.
二、論文撰寫與設(shè)計(jì)研究的目的
摘要:科技論文是科學(xué)研究活動(dòng)的重要產(chǎn)出形式,是反映科研成果、開展學(xué)術(shù)交流的重要手段,是促進(jìn)科技交流與合作的有效途徑,其數(shù)量和質(zhì)量從側(cè)面反映了一段時(shí)期內(nèi)區(qū)域的科研實(shí)力與水平。為此,以中國科技論文與引文數(shù)據(jù)庫(CSTPCD)、SCI、Ei、CPCI-S檢索系統(tǒng)為數(shù)據(jù)統(tǒng)計(jì)源,通過對(duì)四川省科技人員在國內(nèi)外發(fā)表的科技論文情況進(jìn)行回顧性分析,對(duì)四川省科技論文產(chǎn)出能力、學(xué)術(shù)水平及影響力進(jìn)行客觀展示,以了解四川省科學(xué)研究與技術(shù)創(chuàng)新領(lǐng)域的科研實(shí)力及趨勢,為科管部門進(jìn)一步制定科研政策和推動(dòng)科研進(jìn)步提供依據(jù)。
關(guān)鍵詞:科技產(chǎn)出;論文;四川省
0引言
科研論文是科技產(chǎn)出的重要體現(xiàn),從側(cè)面反映了一個(gè)地區(qū)的科技發(fā)展水平和實(shí)力[1]。通過對(duì)四川省科技論文的產(chǎn)出量及影響力(常以被引用情況反映)進(jìn)行統(tǒng)計(jì)和分析,可從一個(gè)側(cè)面反映科學(xué)研究工作的創(chuàng)新性和發(fā)展性,揭示四川省的科研活動(dòng)的活躍程度、科研發(fā)展的現(xiàn)狀及規(guī)律、科研實(shí)績和科技管理水平,從宏觀上了解和把握地區(qū)、學(xué)科、科研人員學(xué)術(shù)水平、科研能力和潛力。利用四川省發(fā)表的國際和國內(nèi)科技論文數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、處理和整序。并從學(xué)科、論文引用與影響、地區(qū)分布情況等不同專題和角度,深入分析2018年度四川地區(qū)科技論文產(chǎn)出的特點(diǎn),及其在國內(nèi)的產(chǎn)出水平和發(fā)展趨勢。
1數(shù)據(jù)來源及統(tǒng)計(jì)范圍
國內(nèi)論文數(shù)據(jù)統(tǒng)計(jì)來自中國科學(xué)技術(shù)信息研究所創(chuàng)建的中國科技論文與引文數(shù)據(jù)庫(CSTPCD);國際論文數(shù)據(jù)采集來自SCI、Ei、CPCI-S檢索系統(tǒng);專利數(shù)據(jù)來自DerwentInnovationsIndex數(shù)據(jù)庫(在作為地區(qū)、學(xué)科和機(jī)構(gòu)統(tǒng)計(jì)用的Ei論文數(shù)據(jù)中,已剔除會(huì)議論文的數(shù)據(jù),僅包括期刊論文,而且僅選擇核心期刊采集出的數(shù)據(jù),會(huì)議論文均在CPCI-S中得以表現(xiàn));論文統(tǒng)計(jì)范圍只是四川省作者為論文第一作者的論文[2]。
1系統(tǒng)設(shè)計(jì)與關(guān)鍵技術(shù)
1.1旱區(qū)農(nóng)業(yè)領(lǐng)域本體構(gòu)建
領(lǐng)域本體為搜索引擎提供知識(shí)組織,是基于本體的旱區(qū)農(nóng)業(yè)垂直搜索引擎的核心模塊。建立針對(duì)西北旱區(qū)的農(nóng)業(yè)領(lǐng)域本體,可以提高搜索引擎的專業(yè)性和查準(zhǔn)率。農(nóng)業(yè)領(lǐng)域本體庫的建立分為創(chuàng)建領(lǐng)域術(shù)語集、創(chuàng)建領(lǐng)域本體和本體存儲(chǔ)等模塊。本文使用基于包裝器的信息抽取技術(shù),從相關(guān)網(wǎng)站抽取與西北旱區(qū)農(nóng)業(yè)相關(guān)的論文題目、摘要和關(guān)鍵詞作為領(lǐng)域語料,經(jīng)過分詞和篩選得到領(lǐng)域術(shù)語,利用參考文獻(xiàn)中提出的面向文本的知識(shí)發(fā)現(xiàn)技術(shù)來構(gòu)建領(lǐng)域本體的方法并對(duì)其加以改進(jìn),設(shè)計(jì)了領(lǐng)域本體創(chuàng)建方法。步驟如下:Step1從網(wǎng)絡(luò)中抽取相關(guān)論文,通過分詞和篩選得到領(lǐng)域術(shù)語集合。Step2運(yùn)用方法對(duì)領(lǐng)域術(shù)語集進(jìn)行領(lǐng)域相關(guān)度判斷,篩選出相關(guān)度較高的術(shù)語,從而得到領(lǐng)域概念集合。Step3對(duì)所得到的領(lǐng)域概念進(jìn)行基于共現(xiàn)的關(guān)聯(lián)分析。Step3.1基于共現(xiàn)分析理論來計(jì)算兩兩領(lǐng)域概念的共現(xiàn)頻次,得到共現(xiàn)矩陣。Step3.2利用Jaccard系數(shù)來計(jì)算領(lǐng)域概念間的相關(guān)度,得到領(lǐng)域概念的相關(guān)矩陣。Step3.根據(jù)領(lǐng)域概念的相關(guān)矩陣,利用Cosine相似度求出每兩個(gè)領(lǐng)域概念的相似度,從而得到相似度矩陣。Step4結(jié)合傳統(tǒng)凝聚層次聚類算法和K-means算法,使用基于K-means的層次聚類算法發(fā)現(xiàn)領(lǐng)域概念間關(guān)系。Step5構(gòu)建農(nóng)業(yè)領(lǐng)域本體并存儲(chǔ)在關(guān)系數(shù)據(jù)庫MySQL中。
1.2信息采集和過濾
旱區(qū)農(nóng)業(yè)垂直搜索引擎的應(yīng)用是面向西北旱區(qū)農(nóng)業(yè),需要采集旱區(qū)農(nóng)業(yè)相關(guān)信息,過濾掉無關(guān)信息。領(lǐng)域相關(guān)信息過濾是保證搜索準(zhǔn)確度的關(guān)鍵因素。為了保證采集的網(wǎng)頁信息和西北旱區(qū)農(nóng)業(yè)緊密相關(guān),本文采用主題蜘蛛和本體結(jié)合的方法按照鏈接過濾、信息獲取、頁面分析和主題相關(guān)性,判定4個(gè)部分從網(wǎng)絡(luò)中采集并過濾西北旱區(qū)農(nóng)業(yè)信息,處理流程如圖2所示。首先,獲取URL地址并過濾掉一些無效和重復(fù)的鏈接;其次,下載有效URL對(duì)應(yīng)的網(wǎng)頁,對(duì)網(wǎng)頁內(nèi)容進(jìn)行解析,采用分析DOM樹的信息抽取方法,清理無關(guān)Html標(biāo)記,獲取網(wǎng)頁正文和新的URL;再次,對(duì)網(wǎng)頁正文進(jìn)行特征詞提取;最后,進(jìn)行基于本體的網(wǎng)頁主題相關(guān)度判定,若網(wǎng)頁與西北旱區(qū)農(nóng)業(yè)主題關(guān),則對(duì)該網(wǎng)頁構(gòu)建索引,否則拋棄。對(duì)于新的URL,則跳轉(zhuǎn)到URL鏈接過濾步驟,循環(huán)進(jìn)行信息采集和過濾。
由于主題相關(guān)性判定部分是決定網(wǎng)頁信息采集質(zhì)量的關(guān)鍵因素,因此本部分著重介紹主題相關(guān)性判定算法。目前,頁面與主題相關(guān)性判定主要有5類方法,即根據(jù)元數(shù)據(jù)的判定、根據(jù)擴(kuò)展元數(shù)據(jù)的判定、根據(jù)鏈接分析的判定、根據(jù)頁面內(nèi)容語義判定和基于特征詞的向量空間模型算法。本文采用基于特征詞的向量空間模型算法,但是這種方法已被證實(shí)精確度不夠高,因而結(jié)合旱區(qū)農(nóng)業(yè)領(lǐng)域本體對(duì)該算法進(jìn)行改進(jìn),提高采集網(wǎng)頁信息的正確率。利用領(lǐng)域本體概念及概念間結(jié)構(gòu)關(guān)系對(duì)特征詞進(jìn)行語義豐富,判定網(wǎng)頁與主題的相關(guān)性,從而在一定程度上實(shí)現(xiàn)了網(wǎng)頁與主題在語義層面上的相關(guān)性判定。算法描述如下:Step1信息采集之前,對(duì)西北旱區(qū)農(nóng)業(yè)相關(guān)的網(wǎng)頁正文提取關(guān)鍵詞,通過學(xué)習(xí)獲取西北旱區(qū)農(nóng)業(yè)主題的特征詞集合其中,ωi表示特征詞αi在主題特征向量中的權(quán)值。Step2運(yùn)用本體概念間的關(guān)系獲取特征詞集合中每個(gè)特征詞αi上位詞、同位詞和下位詞,并存儲(chǔ)在數(shù)組Ti中。Step3對(duì)采集到網(wǎng)頁P(yáng)進(jìn)行分詞,對(duì)每個(gè)名詞s進(jìn)行判斷。若s在數(shù)組Ti中,則將s替換為αi;然后,統(tǒng)計(jì)αi對(duì)應(yīng)的“信息項(xiàng)頻率”tf和“文檔頻率”df來表示每個(gè)信息項(xiàng)的分布權(quán)重,并運(yùn)用TF*IDF算法。
【摘要】本文探討了在社會(huì)信息化的條件下會(huì)計(jì)數(shù)據(jù)和信息的標(biāo)準(zhǔn)化,寫作論文以便在社會(huì)化的廣度和信息化的深度上,共享和加工利用社會(huì)各界積累的、每天不斷生成的會(huì)計(jì)數(shù)據(jù)和信息資源,充分挖掘和利用其潛在的巨大價(jià)值,以滿足社會(huì)各方面的需要。
各行各業(yè)的經(jīng)營活動(dòng),產(chǎn)生著大量的會(huì)計(jì)數(shù)據(jù)和信息,隨著會(huì)計(jì)電算化的發(fā)展,在各企事業(yè)單位日復(fù)一日的數(shù)據(jù)采集、輸入、儲(chǔ)存、處理、傳遞、等過程中,將海量的、歷史的會(huì)計(jì)數(shù)據(jù)和信息積累在各單位的計(jì)算機(jī)中。從社會(huì)的總體來看,這是一個(gè)巨大的信息資源寶庫。但是,對(duì)這些數(shù)據(jù)和信息資源的利用,還停留在以各單位為中心的加工利用水平上,基本上還沒有在社會(huì)化的廣度上充分共享,也沒有在信息化的深度上進(jìn)行加工和利用,這是資源的極大浪費(fèi)。究其原因,一是缺乏先進(jìn)的信息處理技術(shù);二是缺乏會(huì)計(jì)數(shù)據(jù)和信息充分共享的完整統(tǒng)一的標(biāo)準(zhǔn)。
現(xiàn)在,信息技術(shù)的發(fā)展,已經(jīng)能夠?qū)⒑A康臄?shù)據(jù)采集、儲(chǔ)存在數(shù)據(jù)倉庫(DW)之中,并且能夠以聯(lián)機(jī)分析處理(OLAP)和數(shù)據(jù)挖掘(DM)等技術(shù)進(jìn)行共享和深加工利用。所以,先進(jìn)的信息處理技術(shù)已經(jīng)具備,目前要解決的主要問題是會(huì)計(jì)數(shù)據(jù)和信息的標(biāo)準(zhǔn)化———建立、應(yīng)用會(huì)計(jì)數(shù)據(jù)和信息的完整統(tǒng)一的標(biāo)準(zhǔn)。
一、會(huì)計(jì)數(shù)據(jù)和信息的標(biāo)準(zhǔn)化
觀察會(huì)計(jì)數(shù)據(jù)和信息的加工處理流程(確認(rèn)、計(jì)量、輸入、儲(chǔ)存、處理、傳遞、反饋、輸出、),可以把會(huì)計(jì)數(shù)據(jù)和信息資源分為三類:原始會(huì)計(jì)數(shù)據(jù)、中間會(huì)計(jì)數(shù)據(jù)和會(huì)計(jì)信息、的會(huì)計(jì)信息。
(一)原始會(huì)計(jì)數(shù)據(jù)的標(biāo)準(zhǔn)化采集輸入和儲(chǔ)存