有時候,我們需要將文本轉換為圖片,比如髮長微博,或者不想讓人輕易複製我們的常值內容等時候。目前類似的工具已經有了不少,不過我覺得用得都不是很趁手,於是便自己嘗試實現了一個。
在 Python 中,PIL (Python Imaging Library) 是最常用的繪圖庫,自然地,嘗試從 PIL 開始。
使用 PIL 將文字轉換為圖片
說轉換其實並不恰當,真實的過程是:先在記憶體中產生一張圖片,將需要的文字繪製到這個圖片上,再將圖片儲存到指定位置。代碼如下:
# -*- coding: utf-8 -*- import osimport Image, ImageFont, ImageDraw text = u"這是一段測試文本,test 123。" im = Image.new("RGB", (300, 50), (255, 255, 255))dr = ImageDraw.Draw(im)font = ImageFont.truetype(os.path.join("fonts", "msyh.ttf"), 14) dr.text((10, 5), text, font=font, fill="#000000") im.show()im.save("t.png")
產生的圖片如下:
杯具發生了,漢字沒有正常顯示!
網上搜尋了一圈,發現這好像是 PIL 的一個 bug,PIL 目前的版本中,不能正確處理非 ASCII 字元的點陣字型的渲染。對於像宋體這樣的字型來說,只有 >= 18px 時,才會被當作向量字型處理,也就是說只有當字型 >= 18px 時,文字才能正常顯示:
font = ImageFont.truetype(os.path.join("fonts", "simsun.ttc"), 18)
效果如下:
增大字型雖然解決了漢字不能正常顯示的問題,但還是沒有解決我們一開始的初衷:使用點陣字型進行渲染。但是,這個目標使用現階段的 PIL 似乎有點難以實現了。
使用 pyGame 渲染點陣字型
Python 的第三方模組或組件非常多,可用來繪圖的除了 PIL 之外,就還有Pycairo、matplotlib、pyGame 等。在這兒,我使用 pyGame 來完成點陣字型的渲染工作。
代碼如下:
# -*- coding: utf-8 -*- import osimport pygame pygame.init() text = u"這是一段測試文本,test 123。"font = pygame.font.Font(os.path.join("fonts", "simsun.ttc"), 14)rtext = font.render(text, True, (0, 0, 0), (255, 255, 255)) pygame.image.save(rtext, "t.jpg")
效果如下:
可以看到,使用 pyGame ,點陣字型的問題終於搞定了。
結合 PIL 和 pyGame
pyGame 雖然可以解決點陣字型的渲染問題,但講到對圖片的處理,還是 PIL 更為強大。那麼,我們為什麼不把兩者結合起來呢?用 pyGame 渲染點陣字型,然後用 PIL 產生整張圖片。
代碼如下:
# -*- coding: utf-8 -*- import osimport StringIOimport Image, ImageFont, ImageDrawimport pygame pygame.init() text = u"這是一段測試文本,test 123。" im = Image.new("RGB", (300, 50), (255, 255, 255))#dr = ImageDraw.Draw(im)#font = ImageFont.truetype(os.path.join("fonts", "simsun.ttc"), 18)font = pygame.font.Font(os.path.join("fonts", "simsun.ttc"), 14) #dr.text((10, 5), text, font=font, fill="#000000")rtext = font.render(text, True, (0, 0, 0), (255, 255, 255)) #pygame.image.save(rtext, "t.gif")sio = StringIO.StringIO()pygame.image.save(rtext, sio)sio.seek(0) line = Image.open(sio)im.paste(line, (10, 5)) im.show()im.save("t.png")
原理很簡單,先將文字用 pyGame 渲染為圖片,將渲染結果儲存在一個 StringIO 對象中,然後再用 PIL 載入它。使用 StringIO 的好處是,一切操作都是在記憶體中進行的,不需要先將它儲存到硬碟再用 PIL 讀取,因為硬碟 IO 的效率相對來說是比較低的。
最終效果如下:
到這兒,使用 Python 將文本轉為圖片的功能就基本實現了,用到了 PIL 和 pyGame。
當然,上面的代碼還只解決了最基本的問題,一個真正可用的文本轉圖片工具,還應該解決以下問題:長文本換行問題、英文單詞斷字問題、標點符號換行問題等。關於這些問題的分析篇幅也不短,這一次就先略過了。下面是一個綜合考慮了諸多因素之後產生的《荷塘月色》的: