從華為P20開始的腦洞之旅:AI如何改變未來手機生活

來源:互聯網
上載者:User

標籤:手機AI   HUAWEI P20   

春天到來,跟萬物一起萌生的,還有各式各樣的手機新品…

相比去年的全面屏風潮,今年的手機市場可以說是AI的天下。各式各樣不同等級的AI拍照滿天飛。而華為P20系列的到來,又把移動AI這個話題拉升到了新的熱度。比如說,基於麒麟970搭載NPU帶來的AI專項處理能力,華為P2O首次實現了AI攝影大師系統,在攝影上帶給了使用者瞬間成為大師體驗;而AIS智能防抖系統則利用了NPU提供的Image Recognition能力,對成像品質顯著提升,解決了我們拍照和拍攝視頻時手抖的問題。但是,可能更多消費者的印象中,AI是一個非常強大,類似終結者那樣的存在。即使在今天,我們也能看到AI可以做各種各樣千奇百怪的事情。來到手機裡,難道AI就只能作為攝影的輔助嗎?

當然不是。在我們採訪過的很多移動通訊與AI專家看來,移動AI的終極目標十分清晰,那就是讓手機像人一樣去感知和思考。這條路不會一蹴而就,但已經開啟的閘門當然不會合上。今天我們看到的基於AI專項處理晶片達成的AI攝影,或許可以看做是未來移動AI的初級版本:手機有自身AI算力,有識別和感知能力,能夠自行對外物進行基礎判斷和推理。

那麼不妨讓我們把腦洞炸開一下,想象在這種模式基礎上前進,未來幾年AI將如何改變我們的手機生活。

自然互動普及,APP變得不那麼重要

手機APP這東西絕對是改變全人類生活的逆天發明,但似乎從其誕生之日起,人們就在思考如何取消它。畢竟眼花繚亂的APP背後,隱藏的是生活被嚴重片段化。APP之間的切換互動方式,也似乎成為我們身邊的“時間殺手”。

這種模式能不能被改變呢?或者說,能不能有某種方式,讓我們使用手機的速度進一步加快,而不是在無盡的切換APP間耗費時間呢?從華為P20的創新來看,這種可能正在成為現實。以攝影技術為例,在以前,由於手機終端缺乏專門處理圖片模組,要想獲得一張令自己滿意的圖片,就必須要依賴各種圖片處理App。這種處理方式一是步驟麻煩,二是App只能基於原始圖片的精度來處理,會造成圖片品質的下降。P20的智慧識圖功能的開發可以在拍照的時候就完成人像、風景、夜景等拍照情境的判斷,從而直接作出參數處理。這樣就擺脫了對圖片處理App的依賴,讓使用者所見即所得 (WYSIWYG),一秒變大師。

目前來看,這很有可能只是個開始。隨著手機中聲紋識別、語義理解、NLP技術的進一步成熟和搭載,以及通過機器視覺進行物理識別的不斷強化,以及手機中AI系統對使用者習慣與服務需求的學習能力加強。這些AI技術與手機產品功能的結合與最佳化,令自然互動形式控制手機成為可能。從而我們可以從“APP等著被點”變成“手機主動來提供服務”的新模式。

試想一下,假如你的手機可以在口袋中識別你的聲紋,輕聲說我要約車,馬上就來了車;說我餓了,馬上按照你的口味和身體狀況提供餐飲選擇。或者另一種情況下,當你把手機拿出來對著商品一拍,手機就可以把它買回家;對著風景,立刻得到一張大片。

有專家表示,在未來手機生活中,很可能除了社交與資訊介面之外,手機只留下一個聽覺和一個視覺入口。手機會通過接近人類的聽覺、視覺與理解能力,來把複雜的服務轉化為簡單的互動。

基於AI開始的手機“去應用化”,可以看做是通過讓手機像人類,來節省人類操作手機的時間,甚至達成更多目前手機無法達成的應用功能。

當然,這一切的前提是服務被抽象出來,各APP之間達成資料共用。到那時,商家爭奪的將不再是用資訊佔領使用者時間,而是用通過直接的建議和溝通,影響使用者消費習慣。

物理世界識別帶來奇幻想象

在華為P20系列中,我們已經看到了用手機識別物理世界帶來的神奇體驗,比如識別貓狗、風景、人像來進行拍照。在對風景進行識別的時候,AI攝影大師通過AI演算法將對相機和感應器捕捉到的映像資料進行影像處理、分析和理解,這樣就可以明確拍攝風景的目的。然後通過更複雜的演算法學習機制,對映像特徵進行抓取處理,實現與情境的最佳適配。

此外,P20中還有對文字的識別能力、對使用者抖動的識別與還原,甚至對使用者使用習慣進行識別與學習。

不難看出,AI手機的絕大部分功能,甚至可以說90%以上的功能,都是識別。這是基於機器學習理論下AI發展的基本表現:通過學習和提取物理世界特徵,來不斷加強識別準確率,達成傳統電腦不可能完成的任務。

有意思的是,AI帶來的識別能力,哪怕集中在手機網路攝影機帶來識別能力,都遠遠不只是今天我們看到的識別物體協助拍照,和識別文字達成翻譯。事實上,在永恒疊加的機器學習巴別塔中,對萬物的識別僅僅是個時間問題而已。

未來我們會用手機識別什麼呢?那實在是有太多腦洞了。

比如在旅行中,我們可能不認識某座大廈、某處古迹、某個符號,那麼完全可以拿出手機拍一下,然後背後的知識與資訊就通過知識圖譜轉化到我們面前。今天我們出門踏青已經習慣了識花模式。但這隻是開始,未來旅行中我們或許不需要導遊、不需要翻譯、不需要司機,一部手機輕鬆搞定這個世界。

再比如在飲食中。我們今天拍食物僅僅為了發朋友圈。而接下來,我們似乎可以拍照來識別食物的做法、營養成分、搭配合理度等等。甚至做成一團的“黑暗料理”,也可以依據菜品近似度、食材還原等能力被AI一眼識破,提醒使用者是否進行了不健康飲食。當然,一切飲食建議都要建立在對個體的瞭解上,讓手機學慣用戶健康資料,記錄每一餐的營養曲線,似乎可能成為我們未來的生活。

還有很多這樣來自AI識別的巨大潛力,比如我們可以通過AI來判斷一堆東西有多重,一間屋子有多大。很多工作中的測量和稱重工作都可以下崗了,只帶一部手機就成。

再比如AR需要依靠高精度的環境識別,這也是AI未來的主攻方向之一。當手機中的環境識別能力進一步加強,AR、MR的紀元或許將正式開始。

情境化的泛在識別、多層識別,在今天看來近乎擁有無窮無盡的想象空間。手機AI技術和無數聰明的腦子,將是這場“科幻電影”成為現實的左膀右臂。

經驗、智慧、知識,都可以變成模型,甚至商品

我們在華為P20中,見到了其搭載的AI攝影大師系統。這個系統整合了複雜的演算法與模型,能夠把現實中攝影大師的知識和經驗提煉成一種解決方案,讓小白使用者也分分鐘拍出頂級大片。比如在相機檢測到複雜的情境時,例如同框中有花草和人物,那麼AI攝影大師會通過一套邏輯優先性來給出拍照解決方案,優先設定更重要拍攝物的智能拍攝方案。這就已經類似於將人類攝影師的經驗和判斷力提取為AI模型,讓小白使用者也可以像大師一樣拍出滿意的“進階感”大片。

我們不妨開個腦洞,難道只有攝影大師的智慧與經驗可以被壓縮成AI嗎?其他人的是不是也可以?

事實上,我們在生活中極其寶貴的“經驗”,假如分解成數學語言,大概就是各種參數的模糊控制、對應性和優先順序。只是人腦中沒有這些數學概念,而是可以把他們化為一種似是而非的感覺。

而在AI世界裡,機器學習演算法本身就是對“經驗”的函數抽象和再利用。當這種模式越來越多的來到手機當中,各種經驗、智慧、知識被抽象出來,變成AI模型,成為我們生活中的一部分,似乎已經成為可能。

舉個例子,今天女孩子會看很多美妝播主,學習她們是如何挑選美妝產品的。這往往需要大量學習時間,還不一定選的對。假如忽略這一過程中的快樂與成就感因素,單純把美妝播主的經驗與判斷方式抽象成AI系統,讓消費者可以挑選適合自己的那款AI,不斷用它選適合自己的產品,那麼似乎一切變得更加科學、省時,並且更符合個人化要求。

當我們攝影時可以用攝影大師的經驗(甚至可以在不同攝影師、藝術家的風格之間切換);做飯時可以抽取美食家的風格;閱讀時用到某位大師的品味,那麼手機或許可以變成一種全新的“人類增強器”,我們將節省大量學習成本,卻依舊享有極高的效率和優質的經驗與審美。

這一切,都是從AI手機和AI攝影開始,如果說Mate10和麒麟970是初始遇見AI,那麼P20系列中我們可以說是見證了AI的成長,見證了AI作為一種全新互動方式、價值提供者,來為使用者達成服務的可能。

雖然今天距離我們預想的未來AI生活看似還有很遠,但閘門一旦開啟就不會終止。剩下的,不過是安然欣賞一場技術革命的時間。

從華為P20開始的腦洞之旅:AI如何改變未來手機生活

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.