文 | DoNews 曹雙濤
編輯 | 楊博丞
在日前谷歌舉辦的2024年I/O Connect China谷歌開發(fā)者大會(huì)上,AI大模型多元化成為市場關(guān)注的焦點(diǎn)。
圍繞APP軟件開發(fā),谷歌推出三種不同規(guī)格的Gemini模型。谷歌方面稱,Gemini Nano是最高效的模型,適合處理設(shè)備端任務(wù)。
據(jù)悉,Gemini 1.5 Flash是谷歌迄今為止最快、最經(jīng)濟(jì)的模型,適合處理高容量任務(wù)。面對所有開發(fā)者開放的Gemini 1.5 Pro,支持200萬token 上下文窗口。為減少算力消耗,Gemini 1.5 Pro和1.5 Flash均已上線上下文緩存功能。
考慮到開發(fā)者可能需要更大的靈活性和掌控力,谷歌推出Gemini姊妹大模型Gemma。新發(fā)布的Gemma2相較于Gemma,新增90億和270億參數(shù)兩種規(guī)格。其中,270億參數(shù)版本經(jīng)過優(yōu)化,同時(shí)支持Google Cloud上的單個(gè)英偉達(dá)GPU以及Vertex AI單個(gè)TPU運(yùn)行。
目前Gemini相關(guān)大模型已集成到Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase等開發(fā)工具中,可幫助開發(fā)者編寫、調(diào)試、測試代碼、生成文檔、理解代碼庫等。
以Flutter為例,小米SU7配套應(yīng)用就是基于Flutter所打造。在原有Flutter基礎(chǔ)上,谷歌推出Flutter 3.24和 Dart 3.5。新版最大看點(diǎn)是“Flutter GPU”新API的早期預(yù)覽版。如通過內(nèi)置 Flutter SDK,開發(fā)者可使用Dart代碼訪問GPU,進(jìn)而提高圖像渲染能力。
為方便開發(fā)者使用,谷歌推出多個(gè)Package。如Flutter_Scene可將3D項(xiàng)目直接導(dǎo)入,進(jìn)而提高游戲體驗(yàn)。
此外,谷歌也推出Android Studio ON IDX早期預(yù)覽版,和原有Android Studi不同的是其支持在瀏覽器中完全運(yùn)行。為保證借助AI構(gòu)建應(yīng)用的可靠性、合規(guī)性和安全性。谷歌推出包括如Firebase AI Monitoring 信息中心、Checks AI Safety等開發(fā)組件。
在AI大模型開源席卷全球下,谷歌推出開源大模型項(xiàng)目Project Oscar。但初始階段,Project Oscar僅支持93000條代碼提交以及2000名開發(fā)者Go編程語言項(xiàng)目。
圍繞Web網(wǎng)站開發(fā),隨著Web GPU、WASM和Gemini內(nèi)置到Chrome中,谷歌全新推出的Speculation Rules API可做到搜索即時(shí)導(dǎo)航,擺脫冗長頁面加載。面向單頁應(yīng)用推出的View Transitions API,可提高頁面過渡體驗(yàn)。二者結(jié)合,進(jìn)而保證頁面過渡的無縫銜接。
為保證Web開發(fā)者開發(fā)效率,谷歌順勢推出試和優(yōu)化應(yīng)用Chrome DevTools,其在開發(fā)者網(wǎng)站出現(xiàn)問題時(shí)會(huì)發(fā)出警告和錯(cuò)誤提示。該應(yīng)用已內(nèi)置到Gemini中。
圍繞下一代安卓原生應(yīng)用開發(fā),谷歌推出多款新產(chǎn)品。設(shè)備端AI模型Gemini Nano和系統(tǒng)服務(wù)AI Core;用于業(yè)務(wù)邏輯共享代碼,適用于移動(dòng)端、Web、服務(wù)器和桌面平臺的Kotlin Multi Platform;并為DataStore、Room和ViewModel等多個(gè)Jetpack庫添加Kotlin Multi platform支持。
測試平臺Android Device Streaming,則聯(lián)合小米、OPPO、一加、三星等手機(jī)廠商,方便開發(fā)者進(jìn)行終端測試,現(xiàn)處于Beta階段。Gemini in Android Studio納入Android Studio穩(wěn)定版,新增代碼生成和代碼轉(zhuǎn)換功能,以及AI隱私設(shè)置控制數(shù)據(jù)分享功能。
圍繞云業(yè)務(wù),谷歌提出的云端新旅程具有五大特點(diǎn):一是云上開發(fā)新范式,新推出的Vertex AI功能可實(shí)現(xiàn)上下文緩存和接地功能。二是自成體系的靈活擴(kuò)展,新推出150多種模型,包括Gemini系列、Gemma開源模型、Anthropic Claude模型、Meta Llama模型和Hugging Face模型庫。
三是打破壁壘的跨云之旅,新推出的優(yōu)化PostgreSQL數(shù)據(jù)庫和BigQuery Omni功能,支持跨云互聯(lián)和聯(lián)合查詢以及多“云”協(xié)同。四是輕松實(shí)現(xiàn)強(qiáng)大功能,新推出的自動(dòng)化與智能默認(rèn)設(shè)置,搭建全套云基礎(chǔ)設(shè)施只需45分鐘,包括網(wǎng)絡(luò)、身份驗(yàn)證和日志記錄等。
五是AI智能助力,新推出的Gemini Code AssistIDE插件,提供代碼生成、補(bǔ)全、解釋和測試生成功能。Gemini in Databases則提供SQL生成和數(shù)據(jù)庫操作智能化。
圍繞開發(fā)者發(fā)布多款大模型,無疑彰顯谷歌想要加速推進(jìn)大模型商業(yè)化的決心。但目前谷歌的AI能力,尤其是輸出和檢索能力可能仍需提高。
今年6月份海外用戶在詢問谷歌“制作披薩使用多少膠水”問題時(shí),谷歌AI搜索給出的答案為:據(jù)Business insider2024年5月的相關(guān)顯示文章,谷歌Al搜索結(jié)果建議在披薩醬中加入1/8 杯,即2湯匙,白色無毒的膠水,以防止奶酪滑落。
文章作者KatieNotopoulos 表示,膠水沒有明顯改變醬汁的稠度,而披薩呈現(xiàn)出誘人的橙色。海外媒體The Verge驗(yàn)證后發(fā)現(xiàn),該截圖并非偽造。因披薩中不能加入任何膠水,該答案也引發(fā)海外用戶對谷歌AI檢索能力的質(zhì)疑。
我們在對Gemini實(shí)測過程中發(fā)現(xiàn),一方面Gemini文生圖能力已被關(guān)閉,且Gemini暫時(shí)也不支持文生視頻。另一方面,Gemini的邏輯推理、數(shù)學(xué)計(jì)算能力仍需提高。
我們將2024年高考數(shù)學(xué)真題給到Gemini且特意強(qiáng)調(diào)是多選題,三道題目正確答案分別為(BD)(ACD)(ABC),但Gemini給出的答案分別是(AC)(AD)(AB),雖說第10題和第11題Gemini的答案包括正確選項(xiàng),但第9題卻全部是錯(cuò)誤選項(xiàng)。
此外,隨著谷歌大模型日益增多,正面臨數(shù)據(jù)中心電力消耗產(chǎn)生的二氧化碳排放迅速增加的棘手問題。
谷歌相關(guān)環(huán)境報(bào)告指出,2023年僅谷歌數(shù)據(jù)中心電力消耗就增長17%,由電力消耗所產(chǎn)生的二氧化碳污染較2022年同期增長13%至1430萬噸,大致相當(dāng)于38家燃?xì)獍l(fā)電廠每年可能排放的二氧化碳量。
不僅僅是谷歌,Microsoft2023財(cái)年的溫室氣體排放量比 2020年高出約30%。對于未來如何降低碳排放,谷歌相關(guān)報(bào)告指出,隨著我們進(jìn)一步將人工智能集成到我們的產(chǎn)品中,由于人工智能計(jì)算強(qiáng)度的增加導(dǎo)致的能源需求增加,以及與我們的技術(shù)基礎(chǔ)設(shè)施投資預(yù)期增加相關(guān)的排放,減少排放可能具有挑戰(zhàn)性。
按照當(dāng)前AI大模型發(fā)展速度,未來對電力需求或?qū)⒊杀对鲩L。作為全球擁有最多數(shù)據(jù)中心的美國,引發(fā)當(dāng)?shù)孛癖妼θ斯ぶ悄軌旱闺娋W(wǎng)的電力需求急劇上升的擔(dān)憂,并可能使煤炭和天然氣工廠的存在時(shí)間比其他方式更長。
商業(yè)化、輸出質(zhì)量穩(wěn)定化、減碳化等各種問題的存在,即使對于谷歌這樣的全球大廠短期內(nèi)也難言輕松。