国产精品久久久久影院免费_免费一级欧美大片app_色屁屁www影院免费观看视频_久久久91精品国产一区二区

職稱論文咨詢網,專業提供留學生論文、職稱發表論文等各類論文學術咨詢服務的論文網站。

當前位置:首頁 > 論文技巧

文獻綜述標注

來源:職稱論文咨詢網發布時間:2022-08-07 21:47:39

  1、引言

  漢語自動分詞和詞性標注是漢語信息處理中重要的基礎性工作,它與語料庫基礎資源建設相輔相成,在中文信息處理中起著關鍵作用。經過將近20 年的研究,自動分詞與詞性標注技術、語料庫的建設都取得了長足的進步,許許多多的系統應用而生;因此,對分詞與詞性自動標注系統進行公正的評測,將會對這項基礎性的工作起到導向性的作用。二者之間有著十分密切的聯系, 比如, 切分歧義是漢語分詞所面臨的一大難題, 其中能用語法知識消解的就約占90%以上,而涉及語義和語用知識的切分歧義則很少,另外,詞性標注的質量高低直接影響著自動分詞的效果好壞。

  2、漢語自動分詞

  2.1 定義和產生原因

  所謂的自動分詞就是把連續的字串分割成詞的序列。從處理過程來看,把自動分詞可以看作是用計算機自動識別文本字符流中的詞并在詞與詞之間加入明顯切分標記的過程。

  詞是最小的能夠獨立運用的有意義的語言單位,英文單詞之間以空格作為自然的分隔符。漢語是以字為基本的書寫單位,詞語之間沒有明顯的區分標志,計算機不能通過英文句子之間的空格方法區分漢語詞,否則可能會出現錯誤。

  如漢語中“學生”整體是一個詞,但計算機不容易理解“學”和“生”兩個字合起來才能表示一個詞,為了解決類似的問題,中文分詞技術應運而生。

  2.2 自動分詞的分詞方法

  關于分詞方法,蘇聯學者最先提出了關于“ 6-5-4-3-2-1”的思想,這種方法中的匹配思想成為后來許多分詞方法的基礎。目前,漢語自動分詞方法不下二十種,例如,最大匹配法、知識分詞方法、鏈接法,在參考眾多文獻的基礎上,綜合各家之言,大體上可概括為四種類型:基于詞典的分詞方法、基于統計的分詞方法、基于理解的分詞方法和基于人工智能的分詞方法。這些分詞方法各有其特點,分別代表著不同的發展方向。其中基于詞典的分詞方法具有算法成熟,易于實現的特點,目前是使用最普遍切分方法;基于統計的分詞方法由于有的歧義切分能力和低頻詞識別能力,受到越來越多的研究人員的重視,發展較快,但在實際使用中,很少單獨使用,一般都與基于詞典匹配的信息進行更多的處理,因而加大了實現的難度;基于人工智能的分詞方法是目前理論上最為理想的分詞方法,但是該類分詞方法的研究還處于初級階段,并且由于漢語自然語言復雜靈活,知識表示困難,所以對于這類分詞技術還需要進行更深入和全面的研究。

  2.3 自動分詞研究現狀

  經過十幾年的研究,漢語自動分詞技術取得了令人矚目的成果,出現了一些實用的自動分詞系統,如:北京航空航天大學的c d w s分詞系統,這些系統在分詞的精確度和分詞速度方面都具有相當的水平,并在一些中文全文檢索系統中得到了應用。中文自動分詞技術取得了可喜的進步,具體表現在:

  “詞”是否有了清晰的界定。原來很難精確定義的“詞”,現在可通過“分詞規范+詞表+分詞語料庫”的方法,使中文詞語在真實文本中得到了可計算的定義,界定出詞語的邊界,這是實現計算機自動分詞和可比評測的基礎。

  未登錄詞對分詞精度的影響。對交集型歧義字串進行的大規模語料庫調查,明確提出把分詞歧義消解過程分解為偵察和消歧兩個子過程的認識,都是近十年來分詞研究的重大收獲.

  基于字的分詞新方法.過去的分詞方法大都依賴于一個事先編制好的詞表或詞典。自動分詞過程就是通過詞表和相關信息來做出詞語切分的決策。基于字標注的分詞方法實際上是構詞方法。即把分詞過程視為字在字串中的標注問題。這種方法的一個重要優勢在于,它能夠平衡地看待詞表詞和未登錄詞的識別問題。

  2.4 困難和問題

  盡管漢語自動分詞取得了重大進展和突破,但仍有大量的問題困擾著這一領域的學者們。因為要自由進行漢語自動分詞,至少會遇到以下一些困難:

  (1) 中文原本沒有詞的概念 ,至今也沒有統一的詞的確切定義。漢語詞與詞之間既沒有西文那樣有明顯的分隔符,也沒有日文那樣豐富的詞尾變化。

  (2)漢語迄今為此仍未有一部公認的、確切完備的并適合于計算機自動處理的語法規則。

  漢語無標準性的詞法、復雜性的句法、模糊性的語法與多樣性的語義,如漢語中大量存在多義詞、同義詞、詞性變化、詞義轉借等現象,使漢語表達具有很大的靈活性,所以任何人都都很難對它進行完備的總結。

  (3)中文構詞方法的多樣性和句法的“意合”性等特點也是造成自動分詞困難的重要原因。中文造詞的原料,不僅有字,而且有詞、詞組。造句的方式有以字造詞、以詞造詞,甚至壓句成詞。如果沒有語法、語義知識或語境的幫助就很難對有些句子進行正確切分。

  (4)語音中所蘊含的部分有用信息在書面語中無從體現。

  (5)新詞在不斷增加,如人名、地名、新產生的詞、外來詞等日益充實著漢語詞匯。

  但最重要的困難還是歧義切分和未登錄詞的問題。歧義切分有兩種類型,一種是交集性切分歧義,另外一種是組合型切分歧義,如漢字串“將來”是一個詞,其中“將”和“來”也可以單獨成詞,這就涉及到如何切分的問題。組合型歧義是切不切開的問題,交集型歧義是切在哪里的問題。未登錄詞即是指未包含在分詞詞表中的詞,包括各類專名(人名、地名、企業字號和商標號等)、某些術語、縮略語和新詞等,由于專用術語繁多,新名詞、新概念層出不窮,這些詞一般很難全部收錄到詞典中,但這些詞往往在一定時期內呈現較高的檢索概率。這就要求分詞系統具有一定的未登錄詞識別能力,從而提高分詞的準確性。

  對于分詞的歧義處理,目前已經進行了比較深入的研究,人們通過統計和規則相結合的方法,使得歧義字段的正確切分達到了較高的水平 ,同時也認識到歧義的解決需要細致的個性化的知識積累,對不同類型的歧義要有不同消歧方法,同時研究漢語的構詞規則,增強歧義判別能力;另一方面,無論詞表規模多么大,未登錄詞語的存在是必然的。因此,與分詞的歧義處理相比較,未登錄詞語的處理成為影響分詞精確率的最主要、最直接的因素,這也是當前的一個研究的難點和熱點。

  3 、漢語詞性標注

  3.1 基本含義和標注方法

  詞性標注即在給定的句子中判定每個詞最合適的詞性標記,關鍵是如何處理兼類詞或多義詞。詞性標注的正確與否對后續的句法分析、語義分析有很大的影響,是中文信息處理的基礎性課題之一。常用的詞性標注模型有n 元模型、隱馬爾科夫模型、最大熵模型、基于決策樹的模型等。其中,隱馬爾科夫模型是應用較廣泛且效果較好的模型之一。

  由于同一個詞在不同的語境下會產生不同的詞性特征,所以就產生了不同的標注方法。目前主要存在以下四種方法:基于規則的方法;統計方法;規則和統計結合方法;基于轉換的錯誤驅動學習方法。基于規則的方法利用規則對多個詞性的詞進行消歧,利用上下文信息來排除多余詞性。它能夠利用現有研究成果,通過對語境中的詞語、詞類和詞語的特征做細致描述,起到很好的排歧作用,但主觀性較強,覆蓋率低;統計方法可以將一些不確定的知識量化,可以獲得較好的效果和提高覆蓋率,現在一般用統計方法來標注詞性,據說可以獲得95%以上的正確率,但實際消歧效果究竟怎樣,尚不明確;規則和統計結合方法融合了二者的優點;基于轉換的錯誤驅動學習方法是一種這種的方法,它在詞性標注中能達到98%的正確率。

  3.2 困難和問題

  漢語詞性標注的困難主要是因為漢語作為一種孤立語,缺乏嚴格意義上的形態標志和形態變化,詞類判定基礎是根據詞的已實現的句法功能,對上下文的依賴特別嚴重。

  漢語詞性標注的困難具體可分為:①漢語缺乏詞的形態變化,不能像印歐語那樣,直接從詞的形態變化上去辨別出詞的類別;②常用詞的兼類現象普遍。兼類詞不僅使用頻度高,而且兼類現象復雜多樣,覆蓋面廣,兼類現象分布不均,漢語中大部分詞類都有兼類現象,使得詞類歧義排除的任務困難重重;③研究者本身的主觀因素也會造成兼類詞處理的困難。

  4、應對策略

  正因為在自動分詞和詞性標注上還面臨很多的困難,所以我們今后的研究應著重在某些點上的“有所為”,才能有助于達到我們的想要的結果。結合自己的學習和對其他學者的總結,具體地講,大概要抓以下一些工作:l)盡快建立一個質量高、易接受的通用詞表。這是保證其它一切自動分詞研究是否扎實、可靠的先決條件;2)建立一套為學界同仁認同并遵守的漢語自動分詞規范和詞性標注規范和技術標準,建立詞性標注平衡語料庫,做好系統評測,各家的工作成果應盡量共享,避免簡單重復;3)在通用詞表及極大規模語料庫的支持下,系統地發現那些頻度高、穩定性好的切分歧義,并有針對性地給出解決辦法;4)對覆蓋型切分歧義的研究目前十分薄弱,統計手段似乎心有余而力不足,應該尋求新的對策;5)促進己有的各種專有名詞識別機制向更加精細化方向發展,并增設少數民族人名等特殊字詞的識別機制; 6)以已有工作為基礎,構造更加合理的自動分詞評測模型,爭取評測工作的權威化、公開化、持續化。

  漢語自動分詞已經被研究了二十多年,涉及的內容很多,分詞方法層出不窮,取得了不少成就,但目前仍是制約中文信息處理發展的一個瓶頸。詞性標注是一個比較活躍的應用領域,它直接影響到語法分析、文本信息檢索等諸多領域,它與自動分詞相輔相成,詞性標注錯誤必然導致分詞錯誤。就目前情況來看,自動分詞和詞性標注在許多方面有許多的突破,但同時也都面臨著很多的困難和挑戰,相信隨著科技的發展和知識的進步,這些難題終究會被逐一擊破。

相關閱讀
學術咨詢服務
?
国产精品久久久久影院免费_免费一级欧美大片app_色屁屁www影院免费观看视频_久久久91精品国产一区二区
<tt id="777rq"><em id="777rq"><video id="777rq"></video></em></tt>

  1. <var id="777rq"><tbody id="777rq"></tbody></var>

      免费高清在线视频一区·| 亚洲午夜精品在线| 91视频国产资源| 亚洲第一综合色| 久久久www成人免费毛片麻豆| 丰满少妇久久久久久久| 亚洲国产精品麻豆| 久久免费偷拍视频| 欧美视频一二三区| 国产麻豆一精品一av一免费| 夜夜亚洲天天久久| 国产亚洲成aⅴ人片在线观看| 在线精品视频小说1| 国产主播一区二区三区| 亚洲你懂的在线视频| 精品区一区二区| 欧美亚洲一区三区| 国产99精品国产| 秋霞午夜av一区二区三区| 日韩毛片视频在线看| 精品国产乱码久久久久久蜜臀 | 欧美三级在线播放| 国产成人免费xxxxxxxx| 视频一区二区欧美| 亚洲日本在线a| 久久精品网站免费观看| 在线播放91灌醉迷j高跟美女| 成人丝袜视频网| 精品一区二区三区香蕉蜜桃 | 日韩国产欧美在线播放| 国产精品电影一区二区三区| 欧美电视剧免费全集观看| 色美美综合视频| 成人h动漫精品| 国产一区二区三区电影在线观看| 午夜激情综合网| 亚洲一区二区偷拍精品| 国产精品久久久久aaaa樱花| www激情久久| 欧美mv日韩mv国产网站| 91精品国产一区二区人妖| 在线免费观看日本一区| 色综合久久中文综合久久牛| 成人高清av在线| 国产成人av一区二区三区在线| 麻豆免费看一区二区三区| 性感美女极品91精品| 亚洲成人手机在线| 一区二区激情小说| 亚洲一区二区三区四区在线观看| 亚洲视频资源在线| 亚洲视频每日更新| 亚洲图片欧美激情| 一区二区三区四区av| 一区二区三区欧美激情| 一区二区三区鲁丝不卡| 亚洲精品免费播放| 玉足女爽爽91| 亚洲成a人v欧美综合天堂下载| 亚洲va国产va欧美va观看| 午夜精品久久久久久久久| 午夜精品久久久久久久久| 日韩制服丝袜av| 蜜臀av一区二区在线观看 | 国内精品久久久久影院色| 奇米综合一区二区三区精品视频| 免费亚洲电影在线| 国产一区视频网站| 粉嫩在线一区二区三区视频| 成人av电影在线| 色哟哟精品一区| 欧美日本不卡视频| 日韩精品一区在线| 亚洲国产精品成人久久综合一区| 中文字幕亚洲视频| 亚洲成a人在线观看| 免费成人在线播放| 国产精品一区二区久久精品爱涩| 成人激情小说网站| 欧洲视频一区二区| 日韩欧美亚洲另类制服综合在线| 久久女同性恋中文字幕| 亚洲色图另类专区| 日本不卡一二三| 国产电影精品久久禁18| 色婷婷亚洲精品| 欧美成va人片在线观看| 成人免费在线播放视频| 亚洲成a人片综合在线| 国产一区美女在线| 在线亚洲人成电影网站色www| 制服丝袜国产精品| 亚洲国产精品av| 日欧美一区二区| 成+人+亚洲+综合天堂| 5月丁香婷婷综合| 国产精品乱人伦一区二区| 亚洲成a人片在线观看中文| 国产精品99久久久久久宅男| 色8久久精品久久久久久蜜| 精品第一国产综合精品aⅴ| 亚洲免费观看高清| 国产美女娇喘av呻吟久久| 欧洲一区在线观看| 国产色产综合色产在线视频| 亚洲二区在线观看| 成人av在线资源网站| 欧美电视剧在线观看完整版| 亚洲精选视频免费看| 国产精品主播直播| 91麻豆精品久久久久蜜臀| 亚洲品质自拍视频网站| 国产美女久久久久| 欧美一区二区三区在线观看视频| 亚洲日本青草视频在线怡红院| 蜜臀a∨国产成人精品| 91成人免费网站| 国产精品久久久久久久久久免费看| 青娱乐精品在线视频| 91久久精品午夜一区二区| 久久久99精品免费观看| 日本午夜精品一区二区三区电影| 91免费视频观看| 国产精品久久久久久久久免费丝袜 | 国产在线视视频有精品| 欧美亚洲国产一区二区三区| 中文字幕av一区二区三区免费看| 精一区二区三区| 91精品国产综合久久国产大片| 亚洲黄色性网站| 99精品视频一区二区| 中文字幕欧美日韩一区| 国产永久精品大片wwwapp| 欧美大尺度电影在线| 奇米777欧美一区二区| 欧美久久久久中文字幕| 亚洲午夜av在线| 欧美主播一区二区三区| 亚洲精品免费视频| 日本精品裸体写真集在线观看| 中文字幕欧美一| 91老司机福利 在线| 亚洲视频免费观看| 色综合天天综合网天天狠天天| 日韩一区在线看| 色婷婷av一区二区| 亚洲综合一区在线| 欧美日韩在线亚洲一区蜜芽| 亚洲电影视频在线| 欧美高清你懂得| 美女视频免费一区| 久久综合一区二区| 国产盗摄一区二区| 中文字幕亚洲区| 欧洲一区二区三区在线| 亚洲一区二区黄色| 这里只有精品视频在线观看| 男女男精品视频网| 久久久久国产精品麻豆ai换脸| 国产精品1024| 亚洲人成在线观看一区二区| 91黄色免费网站| 午夜精品久久久| 欧美成人一区二区| 懂色av中文字幕一区二区三区 | 99久久精品免费看国产| 亚洲欧美激情小说另类| 欧美天堂一区二区三区| 免费看日韩精品| 国产欧美日韩三级| 91激情五月电影| 天堂蜜桃91精品| 久久久99精品免费观看不卡| 91小视频免费观看| 日韩福利视频导航| 国产午夜精品久久| 91黄视频在线观看| 九九**精品视频免费播放| 国产精品丝袜黑色高跟| 欧美色区777第一页| 精品一区二区三区免费观看| 中文字幕一区av| 欧美人妇做爰xxxⅹ性高电影| 国产制服丝袜一区| 玉米视频成人免费看| 精品少妇一区二区三区在线视频| 成人高清在线视频| 日韩成人免费在线| 国产精品欧美综合在线| 91在线国产福利| 精品一区二区三区免费视频| 日韩理论片一区二区| 日韩你懂的在线观看| 91视频在线看| 国产美女娇喘av呻吟久久| 亚洲国产精品影院| 中文天堂在线一区| 日韩欧美在线一区二区三区| 99久久精品国产观看| 国产一区二区成人久久免费影院|