這篇文章主要為大家詳細介紹了python使用者評論標籤匹配的解決方案,具有一定的參考價值,感興趣的小夥伴們可以參考一下
我們觀察使用者評論發現:屬性詞往往和情感詞伴隨出現,原因是使用者通常會在描述屬性時表達情感,屬性是情感表達的對象。還發現:屬性詞和專用情感詞基本都是名詞或形容詞(形謂詞)。
演算法流程圖如下:
評論資料如下:
代碼如下:
#encoding=utf-8 ############################# # # 功能:給定一些中文的產品評論,希望從中找到評價對象及評價詞。 # # @author:licl # ############################## fdata = open('JD_DFB_comments_out.txt','r') Output = open('Pattern_Result.txt','a') try: data = fdata.readlines() listline = [] for line in data: listline = line.replace(" ","/") listline = listline.split("/") i = 1 while i < len(listline): if listline[i] != "名詞": i = i+2 else: new_list = ["","",""] new_list[0] = listline[i-1] a = i-1 i = i+2 while i < len(listline): if listline[i] == "標點": i = i+2 break else: if listline[i-1]=='不' or listline[i-1]=='不怎麼樣' or listline[i-1]=='不怎麼' or listline[i-1]=='不太': new_list[1] = listline[i-1] if listline[i] == "形容詞" or listline[i] == "形謂詞": new_list[1] += listline[i-1] b = i-1 t = (b-a)/2 new_list[2] = str(t) for line in new_list: Output.write(line + " ") Output.write("\n") break else: i = i+2 except: print "‘檔案不存在'或者‘檔案無法開啟'" finally: fdata.close() Output.close()