戴了「Ray-Ban Meta」兩個月,我開始相信 AI 眼鏡的未來|Meta|AI|雷朋

摘要

2024 年最火的智能產(chǎn)品,這款眼鏡可能是人與 AI 最近的入口。

作者 | Li Yuan編輯?| 鄭玄

Meta 聯(lián)合雷朋推出的「Ray-Ban Meta」智能眼鏡(以下簡稱「Meta 眼鏡」),可能是 2024 年最受關(guān)注的智能產(chǎn)品。

自去年十月發(fā)售起,Meta 眼鏡已經(jīng)在全球銷售了超 100 萬臺。不過,其真實的銷售潛力遠不止于此——扎克伯格在許多場合提到,這款產(chǎn)品的需求量比預期更高,導致不少款式售罄,用戶只能買到最基礎的黑色款式。

Meta 眼鏡的銷量之高,甚至改變了扎克伯格的認知和 Meta 的戰(zhàn)略:「一年半前你問我什么時候人們會更喜歡使用眼鏡作為主力設備使用,我會說要到眼鏡的顯示效果足夠好的時候。現(xiàn)在我認為可能有三種路徑,其中一種是無顯示屏只具有人工智能的眼鏡。」扎克伯格講道。

Meta 眼鏡為眼鏡增加了攝像、耳機,和最引人注意的——AI 功能。呼喚 Hey Meta,就可以與 Meta AI 對話。除此之外,這款眼鏡沒有加入任何 VR、AR 等增強顯示效果的技術(shù)。但消費者對這樣一副沒有顯示增強效果的眼鏡趨之若鶩。

這或許是比銷量更重要的,這款產(chǎn)品跨時代的意義所在。即在一種全新的交互范式下,我們或許正在見證智能眼鏡像無線耳機、智能手表一樣,成為一個數(shù)億乃至十億人每天使用的超級可穿戴設備。

為了驗證這個念頭,筆者自費購入了一臺 Meta 眼鏡與它一起工作、、生活,深入使用了幾個月后,對于 AI 與眼鏡結(jié)合帶來的可能性,以及智能眼鏡的未來,筆者有了新的想法。

可以每天佩戴的智能眼鏡

首先必須要明確的一點是:從今天來看,AI 只能說是 Meta 眼鏡的一個添頭,賣爆本身還是因為這是一款好的眼鏡。

在 Meta 2023 年 9 月推出這款智能硬件之前,Meta 和雷朋曾在 2021 年 9 月推出其聯(lián)名的初代產(chǎn)品:Ray-Ban Stories。只看產(chǎn)品定義,兩代產(chǎn)品似乎變化不大:都是采用雷朋眼鏡的鏡框進行二次設計,為眼鏡增加了攝像和音頻功能。

不過初代產(chǎn)品,在兩年的全生命周期中,只賣出了 30 萬臺。而 Meta 眼鏡,在 2023 年 9 月推出后,一個季度就賣出了 30 萬臺,且銷量增幅穩(wěn)定,加上 2024 年的上半年,Meta 眼鏡已經(jīng)出貨量超過 100 萬臺。

相比之下,2022 年,全球智能音頻眼鏡市場總出貨量只有 343 萬副,而同樣主打輕便的 AR 眼鏡產(chǎn)品,2023 年整年,全球消費級 AR 出貨量為 20.5 萬臺。

什么讓 Meta 眼鏡成為變數(shù)?

筆者認為 Meta 眼鏡的成功,可以總結(jié)為一句話:這是第一款可用,且有用的智能眼鏡。

前面提到,過去幾個月里,筆者一直將 Meta 眼鏡作為主力眼鏡佩戴和使用。

這是一項不尋常的成就。

作為一個對于眼鏡的舒適度和美觀度要求偏高的消費者,能夠?qū)?Meta 眼鏡作為主力眼鏡,首先意味著,Meta 雷朋智能眼鏡,做到了本身是一副好戴的眼鏡。

對于消費者而言,一副好戴的眼鏡意味著什么?

首先是外觀。從外觀來看,Meta 雷朋眼鏡,與一副普通的雷朋太陽鏡非常相似。

Wayfarer 太陽鏡,非智能款與智能款的對比

除了眼鏡正面的邊角裝飾位置,有細微的差別,一副 Meta 眼鏡,看起來與一副普通的眼鏡差別很小。

美觀問題見仁見智,不過 Meta 眼鏡用雷朋經(jīng)典的設計,盡可能地繞開了公司在美學上積累不足的問題。筆者曾經(jīng)將 Headliner 的眼鏡給編輯部不少同事進行試戴,得到了「誰戴誰好看」的評價。

這一代的 Meta 眼鏡目前共推出了 Wayfarer(方框)、Headliner(圓框)、Skyler(貓眼)三種框架,每種框架有四種顏色可以選擇,鏡片可選墨鏡、變色、偏光和防藍光的選項,也可以買后由消費者自己去眼鏡店選購適配,盡可能給了消費者足夠多的選項。

其次是舒適度。Meta 眼鏡,官方重量為 48 克,已經(jīng)接近了消費者佩戴眼鏡的舒適區(qū)。在使用 Meta 眼鏡作為主流眼鏡之前,筆者日常佩戴的眼鏡重約 30g,不常佩戴的大框變色眼鏡,則重約 40g。

Meta 眼鏡也著重保留了雷朋鏡框鏡腿的獨特設計。在鏡腿越過耳朵的位置,盡可能地保持了雷朋眼鏡原本的彎度和漸細的曲線,以保證佩戴的舒適。

筆者采訪的供應鏈人士告訴筆者,為了保證這樣的鏡腿曲線,Meta 沒有采用常見的長方形或雙橢圓型揚聲器,而是特意定制了異形揚聲器來保持鏡腿的設計感和舒適性。

在筆者實際的佩戴中,佩戴 Meta 眼鏡比起佩戴普通眼鏡,眼鏡的存在感還是明顯更強——由于重量的原因,眼鏡會更頻繁地滑落,舒適度比普通眼鏡差一些。不過,在長時間的佩戴中,這種不適感并沒有強烈到無法忽視,在最初的不適應過去之后,筆者可以完全將其視為一副偏重的眼鏡,進行正常佩戴。

不過,只有像眼鏡,還不足以奠定 Meta 眼鏡今日的成功。Meta 與雷朋聯(lián)名的初代產(chǎn)品,外觀與今日的 Meta 眼鏡幾乎相同,官方重量僅多出 1.2g。

能夠?qū)?Meta 眼鏡作為主力眼鏡進行佩戴,更關(guān)鍵的因素是,Meta 眼鏡給了消費者一個足夠好的理由,讓其心甘情愿地將 Meta 眼鏡作為主力眼鏡而在這一代產(chǎn)品上,這一點是 Meta 的攝像和耳機功能。

在 Meta 眼鏡的初代版本中,已經(jīng)存在這兩個功能,不過,當時這兩個功能的可用性并不高。而這一代的 Meta 眼鏡,則真正將這兩個功能做到了「可用」甚至「好用」。

第一次戴上 Meta 眼鏡,你會立刻感覺到 Meta 眼鏡的不同。筆者戴上的第一反應,就是被其揚聲器的音質(zhì)驚艷。Meta 眼鏡的音質(zhì),與音質(zhì)較好的開放式耳機不相上下,聽音樂也完全不覺得違和。

而視頻功能,更是令人驚喜。事實上,在購買雷朋眼鏡之前,筆者已經(jīng)逐漸意識到有些記錄生活的拍照需求,使用手機難以滿足:比如在高速駕駛的情況下看到了美麗的風景、在騎馬的馬背上不允許攜帶手機的時候、在和兒童或?qū)櫸镞M行交流的時候等等。在這些場景下,掏出手機拍攝,并不是一個很好的解決方案。

之前的最優(yōu)解是購買一個運動相機,不過隨身攜帶運動相機,對于用戶的要求仍然太高了。Meta 眼鏡的出現(xiàn)讓我看到了一種新的可能。

事實上,已經(jīng)有不少視頻創(chuàng)作者,因為這一功能成為第一代 Meta 眼鏡的受眾,不過第一代的 Meta 眼鏡的相機只有 500 萬像素,而新一代的 Meta 眼鏡升級至 1200 萬像素,第一次將視頻/拍照功能做到可用。

在新一代的 Meta 眼鏡上,只需要用右手長按鏡框上的一個按鈕,就可以開啟攝像功能。如果不愿意用手操作,還可以選擇語音操作——喊一句「Hey Meta,開始錄制」。實際測試的效果來看,筆者認為已經(jīng)接近幾年前手機的錄像水平,同時具有極強的防抖效果,最長錄制時間三分鐘。在高速轉(zhuǎn)動的游戲設施上,Meta 眼鏡能仍然保持較為出色的攝影效果。

結(jié)合五麥克風陣列的豪華收音——不少錄音筆甚至不能達到五麥克風陣列的收音,戴著 Meta 眼鏡回看錄的視頻,能夠體驗到沉浸式的音頻體驗,能夠如身臨其境一樣,重新聽到當時錄視頻時不同方位傳來的聲音。

在筆者購買 Meta 眼鏡之前,曾經(jīng)與幾位擁有 Meta 眼鏡的嘗鮮者進行交流,其中促成筆者購買的主要原因之一,就是他們幾位都沒有將其閑置,而是真實地在生活中長時間地使用。Meta 眼鏡高度可用的音視頻功能,是他們愿意長時間使用最重要的原因

其中一位用戶表示,他最喜歡在健身房里一邊健身一邊用 Meta 眼鏡聽歌。而在筆者追問為什么耳機不行時?他的回答是,「因為總是有可能,突然有有趣的東西出現(xiàn)想要拍攝。」

這一回答在當時看起來雖然有些隨意,但在經(jīng)過筆者自己的使用和與多名用戶交流后,發(fā)現(xiàn)有這個心態(tài)的不止他一個,而是 Meta 眼鏡粉絲們的共識。

眼鏡是近視者生活中無法離開的一個必需品,聽音樂、接打電話的長期需求,再加上一個記錄生活的「萬一」,讓 Meta 眼鏡的可用性超越了其佩戴的不舒適性,牢牢戴在每一個購買者的上。

Always on 的硬件與 AI 的化學反應

Meta 眼鏡在 2024 年 4 月,加入了新的 AI 功能。

在產(chǎn)品剛推出時,Meta 眼鏡本身也具備語音助手功能。用戶可以戴上眼鏡,呼喚「Hey Meta」連接特定的軟件,進行簡單操作,如撥打電話,調(diào)節(jié)音量或播放音樂。和現(xiàn)在的 Siri 作用相似,甚至更局限。

而讓 Meta 眼鏡正式成為目前最炙手可熱的 AI 硬件的,正是這次 4 月份的更新。Meta 在對外發(fā)布 Llama 3 大模型的同時,宣布 Meta 眼鏡的用戶,之后再呼喚 Hey Meta 時,除了可以使用之前的功能外,將能夠直接和由 Llama 3 的多模態(tài)的大模型對話。

除了最常見的問答之外,Meta AI 最亮點的能力在于可以使用語音命令「Hey Meta, look and...」,在這條命令后,Meta 眼鏡會自動調(diào)用攝像頭,拍下用戶當前正在看的場景,調(diào)用多模態(tài)大模型的能力,回答用戶的相關(guān)問題。

扎克伯格在社交媒體上親自表演了一段。

在呼喚 Hey Meta 后,扎克伯格對眼前的建筑是什么發(fā)出了提問。而 Meta AI 則迅速分析了提問瞬間 Meta 眼鏡拍下的照片,并返回一個簡短的答案。

在 Meta 新的固件更新中,還增加了對多輪對話的支持——在一輪大模型的回復結(jié)束后,會自動等待一段時間,用戶可以進行追問而不必再次使用 Hey Meta 作為開頭。

筆者也對 Meta 眼鏡的 AI 功能進行了深度體驗。

首先第一個優(yōu)點,是 Meta?AI極低的延遲

每次提問后,Meta AI 會有一個一秒左右的思考提示音。在大量嘗試后,筆者發(fā)現(xiàn),基本上所有的問題,無論是針對當前的視覺問題,還是普通的問答問題,Meta AI 基本上都能在一次提示音后給出回復。

筆者咨詢了相關(guān)的產(chǎn)業(yè)人員,產(chǎn)業(yè)人員猜測,這可能源自 Meta 眼鏡使用的高通 AR 1 芯片,在本地就對進行了簡單的 token 化和預處理,才能達到這樣好的效果。

而或許與極低的延遲相關(guān),Meta AI 本身能力并不是特別強,且 Meta 似乎對 AI 的回復進行了長度限制,超過一定長度后,Meta AI 的回復就會突然停止,這導致 Meta 眼鏡上的 AI 能力的另一個突出特征是:其能做的事,仍然很局限。

事實上,筆者曾經(jīng)一度對于眼鏡中加入大模型的合理性產(chǎn)生懷疑。

以眼鏡 AI 最常宣傳的一個功能的物體識別功能為例,受限于大模型的實際能力,和 Meta AI 本身的限制,Meta AI 在識別物體上的精確性并不高。

例如,如果問 Meta AI 房間里哪里有可以喝水的設備,Meta AI 可以指出房間中有飲水機,而要問到更精確的,如識別一下筆者購買的梔子花到底是哪種花,Meta AI 則識別了三遍才正確識別。識別一把小木棍大概有多少根,則數(shù)出來的數(shù)量與真實情況差距甚遠。

在什么情況下用戶會帶著眼鏡詢問大模型哪里可以喝水呢?這樣的需求幾乎是完全人造的。識別花朵的需求雖然小眾,但是是真實的需求,但是用戶又為什么不掏出手機,在已經(jīng)優(yōu)化地非常好的識別植物的 app 里進行識別,而要使用不成熟的 AI,承受可能三次的錯誤呢?

在今年9月舉行的Meta Connect大會上,Meta還為這款眼鏡加入了實時 AI 翻譯的功能。在現(xiàn)場演示中,扎克伯格講英語,另一個人講西班牙語,雙方進行了一場對話,智能眼鏡充當了翻譯。在這一點上,AI的實用性似乎有所增強。不過,從效果來看,AI的翻譯仍然還是有一定「時差」。

不過,當筆者真的將 Meta 眼鏡作為主力眼鏡,佩戴一個月之后,筆者意識到,一個 Always On 的設備+AI,產(chǎn)生的化學反應,可能是全新的。

眼鏡,作為一個全天候架在眼前的設備,可以隨時聆聽我的召喚。對比呼喚手機上的「Hey Siri」,智能家居中的「你好小愛同學」,對眼鏡呼喚「Hey Meta」,成本更低——無需在任何情況下考慮設備是否聽的見,聽得清,即使是在有雜音的地方低語,也能得到很好的回應。

改變是一點點發(fā)生的。

筆者原本使用 Siri 的主要場景,在于使用 Siri 快速放音樂,而 Meta 眼鏡,作為一個幾乎全天候佩戴的設備,很自然地成為了接收筆者語音指令的第一終端,也是控制音樂播放最方便的設備。Hey Meta 在這個場景下,輕而易舉地就超越了 Hey Siri,成為了我的首選。

而一旦習慣呼喚 Hey Meta,一些全新的,沒想過的自發(fā)需求就生長了出來。

比如,在無聊的路上,Meta AI 可以幫我念首詩,講點,玩猜數(shù)字的游戲。

比如,照鏡子的時候,我會呼喚 Hey Meta,幫我看看是否是一個合適的穿搭。

沒胃口的時候,也可以直接呼喚 Hey Meta,問問有沒有什么可以合適夏天晚上吃的菜,有沒有好的商店在我附近。

這些需求,有的 Meta AI 可以滿足地很好——比如念一首詩,幫我提供夏夜適合吃的菜的靈感,而有的則暫時還做不到——比如騎行到一個陌生的地方幫我推薦一家附近的餐館。

相比手機,眼鏡有著獨特位置優(yōu)勢——全天候佩戴的屬性,加上是在臉上距離嘴巴最近的收音入口讓筆者開始相信AI不斷進步的情況下,智能眼鏡有可能是比手機更適合作為 AI 載體的未來

扎克伯格在接受采訪的時候也講到:「眼鏡替代手機,很可能像手機替代電腦一樣。并不是人們不再使用電腦了,而是在很多場景下,人們首先使用手機來完成,而不是電腦。」

AI 代替顯示技術(shù),讓眼鏡成為第一入口的未來可見了

事實上,行業(yè)認為眼鏡能夠成為未來最重要的智能硬件的判斷由來已久。

2012 年,Google 就發(fā)布了 Google Glass 的原型機概念。Google Glass 的原型機概念是美好的:在眼鏡的右上方,增加一塊光機,把數(shù)字信號投入到眼睛里。Google 希望這個眼鏡能夠做到替代部分手機功能——顯示天氣、消息、電話,用戶可以佩戴它進行拍照、錄影、導航等等。

Google Glass 愿景雖好,但最終呈現(xiàn)的效果卻一般。續(xù)航短、發(fā)熱嚴重不說,最終能夠代替的手機的功能非常有限,無法承載新一代智能終端的愿景。

而吸取了 Google Glass 的教訓,之后的智能眼鏡走向了兩個流派,一是不再強調(diào)替代手機的智能性,而將其主要作為一個消費電子的硬件來對待。如主打拍照分享的前三代Snap Spectacles 眼鏡和主打音頻功能的 Bose 音頻眼鏡。

而另一個流派,則在顯示技術(shù)上不斷加碼,將越來越多的智能功能搬到眼鏡上,甚至是讓眼鏡的智能功能超越手機——Meta 的 Quest 頭顯、蘋果的 Vision Pro 就是這一路線的代表。

然而優(yōu)秀的顯示效果的代價,往往是沉重的重量,和常常被限制在家中游戲和觀影的使用場景。眼鏡獲得了智能的能力,但是失去了 Always On 的場景——人們最初期待眼鏡能夠超越手機成為第一入口,看中的就是眼鏡更便攜,離用戶更近,如果抬眼就能調(diào)用智能功能,自然比手機更容易成為第一入口。

而?AI?技術(shù)的出現(xiàn),或者將帶來第三條路。

在大語言模型技術(shù)出現(xiàn)之前,從手機、智能音箱再到 HoloLens 等 AR 眼鏡也曾引入語言交互,但在當時,只使用自然語言進行交互的效果,很難稱之為智能但只使用自然語言進行語音交互幾乎很難稱之為智能,這意味著以語音交互為主無法支撐起一個計算平臺。

而在今天,大語言模型技術(shù)的出現(xiàn),讓單獨的語音交互的體驗,有了走向足夠智能的可能性。雖然今天 Meta 眼鏡上的 AI 仍然停留在交互玩具的級別,但我們完全可以預期隨著大模型技術(shù)的發(fā)展,擁有攝像頭和 AI 的眼鏡能夠替代今天手機應用的不少場景——無論是點外賣、掃碼支付、獲得陪伴、問大語言模型商店是否具有針對性的優(yōu)惠,實際上在技術(shù)上已經(jīng)都不再是挑戰(zhàn),差的只是平臺的接口尚未打通。

而 AI 技術(shù),也可能帶來很多新的智能能力,比如長期的陪伴,針對個人生活場景真正個性化的推薦等等。

另外一個不可忽視的因素:經(jīng)過 10 多年的發(fā)展,智能眼鏡的幾項關(guān)鍵技術(shù)都在近些年取得了突破,這也是 Meta 眼鏡取得成功,以及支撐智能眼鏡在未來幾年快速增長的重要因素。

幾名熟悉供應鏈的業(yè)內(nèi)人士告訴筆者,在 Google Glass 時代,使用眼鏡進行拍照、甚至進行一定的 AI 功能,續(xù)航和發(fā)熱是不可解的。而 Meta 眼鏡獨家使用高通的 AR1 芯片,使得 Meta 眼鏡的續(xù)航大為提升——官方表示單次續(xù)航約四小時。實測中,如果音樂、攝像功能的使用不頻繁,甚至可以支撐更久。

除此之外,藍牙芯片、攝像頭清晰度、開放式耳機的聲音調(diào)教都在近些年取得了不小的進步。

事實上,Meta 最初也并沒有意識到這一代的 Meta 眼鏡能夠在消費者層面上獲取如此大的成功。上一代的 Meta 眼鏡功能相似,卻沒有取得類似的成功。但正是硬件領域持續(xù)不斷的技術(shù)積累,推動了 Meta 眼鏡的可用性質(zhì)的飛躍,終于突破了智能眼鏡佩戴舒適度的臨界紅線,使其成為消費者愿意長期佩戴的設備。

硬件性能已足以支持全天候運作,軟件智能已達到純語音交互即可勝任復雜任務的水平。

AI 取代傳統(tǒng)顯示技術(shù),使智能眼鏡成為人機交互第一入口——這條顛覆性的第三路徑,或許已近在咫尺。

? 版權(quán)聲明
評論 搶沙發(fā)
加載中~
每日一言
不怕萬人阻擋,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender