蘋果[M4]芯片，將為蘋果開啟怎樣的全AI時(shí)代？

瀏覽：時(shí)間：2024-05-11

正文共：3399字 13圖

預(yù)計(jì)閱讀時(shí)間：9分鐘

最近，蘋果春季發(fā)布會結(jié)束之后，我們從發(fā)布會提取了一個關(guān)鍵詞：【M4】。

確切來說，是蘋果的M4芯片。

時(shí)隔六年，蘋果iPad Pro 終于升級了版本，并且憑借著僅 5.1 毫米的機(jī)身厚度，成功取代 iPod nano 成為史上最輕薄的蘋果設(shè)備。

b70133ba607adfed5a66d631834bc17b-sz_690187

作為此次蘋果全新重磅產(chǎn)品，新一代iPad Pro除了更輕薄，還搭載了首發(fā)蘋果自研M4芯片，讓CPU性能提高35%，GPU性能提升50%。

而這，也是引起業(yè)內(nèi)外關(guān)注的重點(diǎn)。

關(guān)于[M4]算力的猜想

在對M4芯片展開暢想之前，我們先來看看市面上第一梯隊(duì)的芯片GPU算力如何？

驍龍730 1.84 TFLOPS

驍龍740 2.21 TFLOPS

驍龍750 3.15 TFLOPS

英偉達(dá)GTX 1650 2.98 TFLOPS

蘋果A17 Pro ≈ 2.15 TFLOPS

6d760f9fafe24da56f8214d98e311b0e-sz_20780

248c47d741d1781d73bc967c27faf3b4-sz_276211

關(guān)于最新的M4芯片，據(jù)介紹其神經(jīng)引擎具備 38 TOPS（Tera Operations Per Second，每秒萬億次運(yùn)算）的運(yùn)算能力。

38這個數(shù)值看起來似乎非常高，但這包含了GPU+CPU共同的運(yùn)算能力，我們從A17 Pro和第一梯隊(duì)芯片數(shù)據(jù)可以預(yù)測得到，M4芯片的GPU運(yùn)算能力并不會比同行們高出太多，甚至是持平的水平。

這樣一個算是沒有特別亮點(diǎn)的芯片發(fā)布，對蘋果而言，究竟意味著什么？

[M4]將會帶來什么？

在過去幾年里，面對不可忽視的AI大模型浪潮，蘋果卻在AI領(lǐng)域一直按兵不動，這引起了各方猜測：蘋果是否在憋一次大招？還是策略方向的決策失誤？

這些都暫且按下不表。

【M4】究竟會為蘋果帶來什么變化，或者說它將如何為蘋果一直以來的強(qiáng)項(xiàng)——用戶交互帶來什么顛覆性的用戶體驗(yàn)？

（在十多年的發(fā)展中，蘋果主要是通過自主研發(fā)硬件和優(yōu)化軟件的方式，來創(chuàng)建和控制自己的產(chǎn)品生態(tài)系統(tǒng)，這在過去取得了巨大成功。）

這里提出一個問題：大家覺得蘋果是否真的沒有對AI進(jìn)行布局？

首先，是那個十多年前非常先進(jìn)、如今已經(jīng)被各家AI聊天工具甩下幾條街的Siri。

這是蘋果AI最初級的市場呈現(xiàn)，在【M4】背景下，我們大概能猜測，在 iOS 18中它會全面更換算法，用蘋果自己的大語言模型驅(qū)動Siri。

至于這個大語言模型的名字，我們從Ferret到MLLMs，再到上個月透漏出來的ReALM，它叫什么已經(jīng)不是重點(diǎn)，我們暫且就認(rèn)為它叫ReALM。

534c783c7beea87bf6ed127e6a4498e3-sz_53218

有更具體的消息表示，它有80M、250M、1B和3B四個版本的大小，其中哪怕最小的80M模型都已經(jīng)比GPT-4的表現(xiàn)更好，而這個尺寸的模型是可以直接裝進(jìn)運(yùn)存的，最大的3B模型的表現(xiàn)更是超過GPT-4一大截。

80M版本的模型大概率會內(nèi)置在本地，用來處理屏幕實(shí)體內(nèi)容。舉例來說，當(dāng)前你要AI工具幫你處理什么或者識別什么，你至少要把你看到或者要描述的東西用圖片或文字，單獨(dú)發(fā)給AI的輸入界面。

比如，一張圖片里出現(xiàn)了奇怪的東西，你不知道這個東西是干什么用的，你要先截圖，然后把截下來的圖片發(fā)給AI，問它，這個東西是干什么的呀？于是這個步驟就涉及到很讓人頭疼的隱私問題，其次就是不方便。

相當(dāng)多60歲以上的手機(jī)用戶不知道怎么做屏幕截圖，或者要求再高一點(diǎn)，不知道怎么截取圖像中的一部分，但ReALM對屏幕實(shí)體的識別功能就能大幅改進(jìn)以上兩個弱點(diǎn)。

由于隱私和使用體驗(yàn)這兩個關(guān)鍵點(diǎn)，外界猜測蘋果將會把ReALM放在本地運(yùn)行。

畢竟在過去，“隱私”這一核心價(jià)值觀的設(shè)立，對蘋果而言是一塊金字招牌。

RECRUIT

在2017年的WWDC大會上，蘋果宣布采用聯(lián)邦學(xué)習(xí)（Federated Learning）技術(shù)來改進(jìn)Siri的語音識別功能，因?yàn)樗鉀Q了隱私安全和訓(xùn)練大模型之間的沖突。

它可以在設(shè)備上進(jìn)行識別，而不需要將用戶的語音數(shù)據(jù)上傳到云端進(jìn)行處理，從而保護(hù)用戶的隱私。

35c812ce3df1fcf0f7eb461774e713a9-sz_147202

當(dāng)初始化的模型，在本地完成訓(xùn)練后，傳回云端的只是一個基于本地?cái)?shù)據(jù)訓(xùn)練而得到的模型，而不是用戶數(shù)據(jù)本身。

這些本地模型被傳輸回云端后，通過模型聚合的方式，用戶所有的本地模型將合并成一個全局模型。

最后，蘋果會通過模型更新的方式，將合并后的全局模型傳輸回用戶的本地設(shè)備上，替換原有的模型。

如此一來，蘋果既實(shí)現(xiàn)了模型的訓(xùn)練，又保護(hù)了用戶的隱私安全，可謂一舉兩得。

要想在本地運(yùn)行這樣一個龐大的模型，并不是一件簡單的事情，因?yàn)樾枰加煤Ａ康膬?nèi)存。

GPT-4表現(xiàn)搶眼，但它們都是在云端運(yùn)行的，我們的手機(jī)或PC端只是發(fā)出問題和接收答案，所有的計(jì)算都由OpenAI的服務(wù)器群組搞定。

上億人的使用，推理計(jì)算量是非常恐怖的，于是就會開始遇到ChatGPT無響應(yīng)、輸出慢、被黑客攻擊和大家最擔(dān)心的隱私等等問題。

（有趣的是，在和同事討論這個暢想的時(shí)候，他們確實(shí)會第一時(shí)間考慮到關(guān)于隱私方面的隱患。）

ae6573f1e4a2d2616c378d4c8ca61ae3-sz_311448

我們可以最保守地、最粗糙地按照每10億參數(shù)占用1GB內(nèi)存去換算，那么2000億參數(shù)就需要200GB內(nèi)存，然后為了保證其他軟件的順利運(yùn)行，還需要額外多準(zhǔn)備出十幾GB的內(nèi)存，于是能運(yùn)行ReALM大語言模型的蘋果手機(jī)可能需要配210GB內(nèi)存。可今天最頂級的iPhone15 Pro Max是多少內(nèi)存呢？8GB。

要運(yùn)行多模態(tài)大語言模型，需要把內(nèi)存加大26倍才可以，這是不可能的，今天就算是安卓陣營的手機(jī)，最高內(nèi)存也只有32GB，離210GB還遠(yuǎn)得很。

但蘋果還是打算把這個模型放在本地運(yùn)行，方法是使用閃存。通俗地說，就是iPhone存放照片和安裝App的那部分閃存空間。

c19c0a2fb5c616bd2121e4bbd8f74395-sz_16217

通常來說，這么做速度上會慢15-50倍，你可以想象一下，大約1-2秒鐘才蹦出下一個字，一段300字的答案你要等7-10分鐘才能完整顯現(xiàn)出來。

但蘋果所做的突破正在于此——大幅優(yōu)化閃存中大語言模型的運(yùn)行速度。具體方法就是，在大模型運(yùn)行過程中，只保留一開始就激活的神經(jīng)元，后續(xù)每次運(yùn)算都基于前一次參數(shù)的激活狀態(tài)進(jìn)行刪除和添加。蘋果把這個技術(shù)起名為滑窗（sliding window）。此外，還有優(yōu)化傳輸?shù)囊恍┎僮鳌＃▉碜蕴O果的研發(fā)人員發(fā)布的論文，這些研究有些可能是未來幾個月后會應(yīng)用在產(chǎn)品中的，也有一些只是可行性上的嘗試，不一定會用在未來產(chǎn)品上。）

fd5ccaf4bc79a4d0749dad917df240e0-sz_196140

△ 蘋果公司關(guān)于其在多模態(tài)大模型的研究論文。

這樣做是否可行呢？它可能需要一個前提，就是大語言模型在處理前后兩個token的時(shí)候，神經(jīng)元激活的狀況是否高度相似。

而蘋果的優(yōu)勢還不止于此。因?yàn)閕Phone、iPad、MacBook這些硬件里的處理器，不論是A17還是M3，都早早留出了很多神經(jīng)網(wǎng)絡(luò)專用的算力。

比如，對iPhone來說，其實(shí)從2017年就開始首次在iPhoneX的A11處理器中內(nèi)置了神經(jīng)引擎。

至于蘋果是怎么做到只用比GPT-4少得多的參數(shù)量就能達(dá)到很好的性能，那只有等到今年6月10日WWDC2024發(fā)布會上才能最終揭曉。

[M4]將會帶來什么？

總結(jié)來說，就是【M4】背景下帶來的下一代操作系統(tǒng)ios 18，可能是蘋果全面開啟AI時(shí)代的開始。

試想一下，如果嵌入到iPhone中的，是一個能夠在本地部署，并且高度優(yōu)化過后的 Siri ，將會讓手機(jī)成為一個幾乎無所不包的多模態(tài)工具，無論是寫文章、編程，還是繪畫，都能隨時(shí)隨地，在小小的屏幕間實(shí)現(xiàn)。

更重要的是，這將讓AI調(diào)度中樞內(nèi)置到蘋果的生態(tài)系統(tǒng)里，實(shí)現(xiàn)用戶使用的平權(quán)。

所謂的“平權(quán)”，就是不論年齡、不論職業(yè)、不論學(xué)歷、不論學(xué)時(shí)、不論性別等，擺脫各種人群標(biāo)簽限制，每個人在使用蘋果的產(chǎn)品時(shí)，都不會有功能的差距。

也就是解決“有人不會操作和不懂功能”的問題，再也不會有人把智能產(chǎn)品用成初始老人機(jī)的效果，因?yàn)檫@一切都由Siri這樣的“助理”幫你解決了。

也許未來的某天中午，到了飯點(diǎn)，Siri可以根據(jù)你上午看了好幾遍炸雞廣告，分析出你想吃炸雞，并為你選擇附近3公里內(nèi)評分最高的那家直接下單，而你全程不需要參與。

或者在你第二天有行程的時(shí)候，Siri會根據(jù)你的行程，幫你設(shè)置鬧鐘，安排出行時(shí)間，列出行李清單，甚至計(jì)算每個步驟所需要的時(shí)間，然后在合適的時(shí)候打開手機(jī)里的叫車軟件，幫你約一輛網(wǎng)約車，而網(wǎng)約車還是根據(jù)你日常叫車習(xí)慣給你安排的車型。

至少，這真的太適合經(jīng)常要給家里老母親視頻教學(xué)電子產(chǎn)品用法的我了。

2011年，蘋果用一句“Hey，Siri”，讓世界第一次感受到了AI的魅力。

2024年，蘋果用一個【M4】，又讓人們開始對蘋果翹首以待。

— END —

資料來源 | 知乎嘉賓商學(xué)、知乎阿爾法工廠、得道卓克科技參考、知乎無錫軟件資訊發(fā)布、網(wǎng)易號 DeepTech深科技

上一篇: 新起點(diǎn)，新征程！機(jī)器時(shí)代喬遷大喜！

下一篇: 【AI小科普】1次訓(xùn)練用電2.4億度，AI 為啥如此耗電？！

日韩高清免费在线_亚洲高清毛片一区二区|HD中文字幕在线播放,久久一区二区电影,午夜a在线,亚洲精品视频在线免费

蘋果[M4]芯片，將為蘋果開啟怎樣的全AI時(shí)代？