本文將瞭解一個組織如何使用視覺化搜尋引擎和基於雲的存儲來自動化業務流程。
使用視覺化搜尋引擎的移動應用程式變得越來越重要。 隨著技術的日趨成熟,國防、保險、醫療和時尚領域內的用例也越來越多。 在拍照和使用某個演算法識別圖像中的物件的能力方面,需要使用一個用於演算法的資料存儲來執行比較,而且這些資料存儲會逐漸轉移到雲中。 本文將瞭解可用的視覺化搜尋引擎演算法,瞭解它們如何使用資料存儲,如何將您的應用程式連接到這些資料存儲,以及選擇特定供應商解決方案的利弊。
什麼是視覺化搜尋引擎?
雖然視覺化搜尋引擎並不局限于行動裝置(智慧手機或平板電腦),但它們是最普遍的終端或使用者介面,因為現在的行動裝置都有內置相機。 有了這些相機,移動應用程式可以與相機拍攝的圖像進行非同步交互。
通過使用視覺化搜尋引擎,使用者可以拍攝二維圖片並使用 「搜索」 演算法確定圖像是否包含可識別的物件。 這些演算法通過稱為應用程式開發介面 (API) 的軟體連接器部署到移動應用程式中。 來自 IQ Engines 這類視覺化搜尋引擎供應商的 API 使得程式師使用視覺化搜尋引擎技術創建他們自己的應用程式。
一些視覺化搜尋引擎供應商有一些可供使用的預構建移動應用程式,如 Google Goggles。 但是 Google 還需要為 Goggles 部署一個 API,這意味著存在一些用於將應用程式部署到行業的受限制用例。 一家名叫 Macroglossa 的義大利公司也提供視覺化搜尋引擎。 Macroglossa 的部署或使用在業內鮮為人知,但它是 IQ Engines 和 Google 的替代物。 不管所使用的視覺化搜尋引擎如何,它們都與通用的動態能力和流程有關。
使用 IQ Engines VisionIQ 作為示例,使用者可以先使用行動裝置拍攝一張照片,在使用 VisionIQ 載入應用程式時,這會觸發用戶端視覺化搜索進程。 然後,視覺化搜尋引擎 API 服務將會調用伺服器端軟體,引用由基於雲的資料存儲產生的商務規則。 最後,對於公共資料存儲,可以啟用眾包 (crowdsourcing)方式,允許公眾協助完善搜索演算法。 圖 1 演示了該流程。
圖 1. IQ Engines VisionIQ 定義的視覺化搜尋引擎流程
對於用於識別圖像的視覺化搜尋引擎,使用者必須先利用圖像和支援屬性的組合來培訓(training)系統,然後將它們上傳到基於雲的資料存儲上,或者放置到網路爬蟲 (Web crawler) 上。 Google Goggles 使用了網路爬蟲路線。 要使用 Goggles,必須先將圖像和支援屬性或中繼資料轉換成 HTML。 VisionIQ 利用了基於雲的資料存儲,開發人員和技術人員通過 Representational State Transfer (REST)-ful API 將內容上傳到資料存儲。 不管圖像以及與這些圖像(色彩、紋理、日期和品牌)相關的中繼資料是如何掃描或上傳的,演算法都必須分析和繼續完善資料。 圖 2 提供了一個具有相關屬性的圖像示例。
圖 2. VisionIQ 資料模型
請注意,在允許適當成功率的分配進度過程中,搜索演算法和屬性必須反復細化。 將系統訓練到可接受的準確率後,就可以開始部署使用者接受度測試 (UAT) 了。 UAT 使開發人員和組織可以改善圖像和搜索演算法,這使得應用程式在交閃環境光、模糊螢幕和多個角度等真實場景中更加有用。 因為雲經常用於存儲訓練這些系統的資料,所以弄清楚什麼是 「雲」 是明智的。
結合使用雲計算和視覺化搜索
現在,讓我來解釋一下如何結合使用雲計算和視覺化搜尋引擎。