Python面試題 —— 計算資料行表中出現最多次的字元,python試題

來源:互聯網
上載者:User

Python面試題 —— 計算資料行表中出現最多次的字元,python試題

給你一個其中包含不同的英文字母和標點符號的文本,你要找到其中出現最多的字母,返回的字母必須是小寫形式, 當檢查最想要的字母時,不區分大小寫,所以在你的搜尋中 "A" == "a"。 請確保你不計算標點符號,數字和空格,只計算字母。

如果你找到 兩個或兩個以上的具有相同的頻率的字母, 返回那個先出現在字母表中的字母。 例如 -- “one”包含“o”,“n”,“e”每個字母一次,因此我們選擇“e”。

 

輸入: 用於分析的文本 (str, unicode).

輸出: 最常見的字母的小寫形式。

 

範例:

1 get_max_value("Hello World!") == "l"2 get_max_value("How do you do?") == "o"3 get_max_value("One") == "e"4 get_max_value("Oops!") == "o"5 get_max_value("AAaooo!!!!") == "a"6 get_max_value("abe") == "a"

 

如何使用: 對於大多數的解密任務,你需要知道各種字母出現在一段文字的頻率。例如:如果我們知道在哪個字母出現的頻率,我們可以很容易地破解一個簡單的加法密碼或替換密碼。這是語言專家有趣的事情!

 

前提:密碼只包含ASCII碼符號 0 < len(text) ≤ 105

 

普通方法:

利用collections工具中的Counter,對列表中元素出現頻率進行排序。Counter傳回值是一個按元素出現頻率降序排列的Counter對象,它是字典的子類,因此可以使用字典的方法。

 

 1 import re 2 from collections import Counter 3  4 def get_max_value(text): 5     text = text.lower() 6     result = re.findall('[a-zA-Z]', text)  # 去掉列表中的符號符 7     count = Counter(result)  # Counter({'l': 3, 'o': 2, 'd': 1, 'h': 1, 'r': 1, 'e': 1, 'w': 1}) 8     count_list = list(count.values()) 9     max_value = max(count_list)10     max_list = []11     for k, v in count.items():12         if v == max_value:13             max_list.append(k)14     max_list = sorted(max_list)15     return max_list[0]

 

精簡方法:

同樣是使用Counter,但是通過列表推導式,可以使函數更加精鍊。這就是列表推導式的好處。

1 from collections import Counter2 3 def get_max_value(text):4     count = Counter([x for x in text.lower() if x.isalpha()])5     m = max(count.values())6     return sorted([x for (x, y) in count.items() if y == m])[0]

 

最佳方法:

不得不稱讚這種方法,實在是乾脆利落。它巧妙的使用了max()函數。

1 import string2 3 def get_max_value(text):4     text = text.lower()5     return max(string.ascii_lowercase, key=text.count)

 

利用了max()函數的key參數,巧妙的將出現次數最多的字元提取出來。

1 max(arg1, arg2, *args, *[, key=func]) -> value

 

我來為大家解釋一下max(string.ascii_lowercase, key=text.count)這句代碼的原理。

string.ascii_lowercase 等價於 'abcdefghijklmnopqrstuvwxyz' 而max()函數key參數的作用是:篩選符合key函數的傳回值的最大值,如果有多個合格值,則選取第一個。

 

max(range(6), key = lambda x : x>2)>>> 3# 帶入key函數中,各個元素返回布爾值,相當於[False, False, False, True, True, True]# key函數要求傳回值為True,有多個符合的值,則挑選第一個。max([3,5,2,1,4,3,0], key = lambda x : x)>>> 5# 帶入key函數中,各個元素返回自身的值,最大的值為5,返回5.max('ah', 'bf', key=lambda x: x[1])>>> 'ah'# 帶入key函數,各個字串返回最後一個字元,其中'ah'的h要大於'bf'中的f,因此返回'ah'max('ah', 'bf', key=lambda x: x[0])>>> 'bf'# 帶入key函數,各個字串返回第一個字元,其中'bf'的b要大於'ah'中的a,因此返回'bf'max('abcdefghijklmnopqrstuvwxyz', key=text.count) # text = 'Hello World'>>> 'l'# 帶入key函數,返回各個字元在'Hello World'中出現的次數,出現次數最多的字元為'l',因此輸出'l'

 

這樣大家就理解為什麼通過max()函數的key參數就可以求得出現次數最多,且符合字母表排序的字元了吧!讓我們再一次為寫出該函數作者的腦洞點贊!

 

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.