python使用者評論標籤匹配的解決方案

來源:互聯網
上載者:User
這篇文章主要為大家詳細介紹了python使用者評論標籤匹配的解決方案,具有一定的參考價值,感興趣的小夥伴們可以參考一下

我們觀察使用者評論發現:屬性詞往往和情感詞伴隨出現,原因是使用者通常會在描述屬性時表達情感,屬性是情感表達的對象。還發現:屬性詞和專用情感詞基本都是名詞或形容詞(形謂詞)。

演算法流程圖如下:

評論資料如下:

代碼如下:

#encoding=utf-8  ############################# # # 功能:給定一些中文的產品評論,希望從中找到評價對象及評價詞。 # # @author:licl # ##############################  fdata = open('JD_DFB_comments_out.txt','r') Output = open('Pattern_Result.txt','a')  try:  data = fdata.readlines()    listline = []      for line in data:      listline = line.replace(" ","/")   listline = listline.split("/")      i = 1      while i < len(listline):        if listline[i] != "名詞":          i = i+2         else:          new_list = ["","",""]     new_list[0] = listline[i-1]          a = i-1     i = i+2          while i < len(listline):                if listline[i] == "標點":              i = i+2       break            else:              if listline[i-1]=='不' or listline[i-1]=='不怎麼樣' or listline[i-1]=='不怎麼' or listline[i-1]=='不太':         new_list[1] = listline[i-1]       if listline[i] == "形容詞" or listline[i] == "形謂詞":        new_list[1] += listline[i-1]                b = i-1            t = (b-a)/2          new_list[2] = str(t)        for line in new_list:                  Output.write(line + " ")                 Output.write("\n")         break              else:              i = i+2  except:  print "‘檔案不存在'或者‘檔案無法開啟'"    finally:    fdata.close()  Output.close()

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.