兰斯第一部

你在淘寶上看到的圖片和視頻,到底怎樣一步步被機器人接管?

摘要

在讓 AI 協助人類的這條路上,阿里帶來了「魯班」和 Aliwood 兩套 AI 工具,它們將成為淘寶店家日后的重要利器。

給你一秒鐘,你能設計出 8000 張海報嗎?

不要那種粗制濫造的效果,而是能掛在雙十一淘寶網站,被上億人看到的那種,帶有獨特設計風格的作品,你能做到嗎?

不開玩笑,即便效率最高的設計師,也只能說這是 Mission Impossible,但一位 2015 年入職阿里巴巴的新員工魯班,只用了兩年多時間,就達到了這個效率,而且到今年雙 11 時,它將很可能成為具有阿里巴巴 P6 設計師水平的員工。這是什么概念?在阿里,這個等級可以擔綱中等設計項目主創人員。

你可能猜到了,這位魯班并不是人,而是來自阿里巴巴的人工智能產品,而它能擁有這樣速度,得益于人工智能技術近年來的迅速崛起,就在今天下午(4 月 21 日),在 UCAN 大會上,我們見到了煥然一新的魯班系統,這一次,它給人帶來的想象更加豐富。

阿里巴巴智能設計實驗室負責人吳春松

在 2015 年之前,淘寶商品推薦都是通過人工運營控制,但龐大的用戶需求和運營資源的不對等帶來的問題,需要通過技術解決。如果你是淘寶老用戶,你會發現如今的淘寶是「千人千面」的,每個人都會有屬于自己的商品首頁,而專屬于每個人的頁面信息,就需要大量的圖片支持,這就是魯班誕生的原因。

和人學習的過程類似,作為 AI 設計師的魯班,也是從模仿開始,當輸入海量設計海報、banner 等信息之后,它會對于其中的背景、主體、修飾等元素進行識別,由此理解它們間的關系。隨后,魯班會「照貓畫虎」一樣對這些素材進行組合,嘗試風格不同的組合后,這些隨機生成的圖片會通過機器來判斷并進行打分,因此生成一系列最優結果反饋給神經網絡,并最終成為阿里電商平臺對外展示的海報、banner 等圖像。

「2016 年的雙 11,魯班制作了 1.7 億張廣告 banner,如果全靠設計師人手來完成,假設每張圖耗時 20 分鐘,滿打滿算需要 100 個設計師連續做 300 年。」「魯班」創始人、阿里巴巴智能設計實驗室負責人吳春松(花名樂乘)告訴我們,因為每年雙 11 的海量設計需求,設計師需要有這樣的工具幫助提升效率。

實際上,從 2016 年以來,如果你打開淘寶,遇到雙 11 等大型活動,看到那些花花綠綠充滿設計風格的海報作品,不要懷疑,它們的確有不少是機器生成的,并且沒有一張完全一樣。到 2017 年,魯班一天就能完成 4000 萬張海報,平均每秒 8000 張。2018 年,從新手做起兩年時間后,魯班終于迎來了對外開放的時刻。

樂乘告訴我們,今年魯班將會改名「鹿班」,并在五月份把核心能力對外開放,其核心能力主要包含四個方面:

1,一鍵生成:將商品相關素材、文字輸入,選擇自己需要的海報尺寸、風格等,可自動生成符合要求的海報作品。

2,智能排版:將拍攝好的照片和需要的文字輸入,選擇尺寸,可自動生成帶有隨機風格的海報作品或產品展示。

3,設計拓展:將設計完成稿輸入,選擇需要拓展的尺寸,可自動生成相應拓展尺寸的結果。

4,智能創作:擁有自己獨特風格的設計師將自己創作好的系列作品輸入,可以訓練機器,并成為系統新的效果風格。

其中,前三點核心能力主要面向企業和商家,第四點能力則是面向設計師群體,讓他們用另一種方式賣出自己的作品,這樣既能夠讓設計靈感變現,同時也能為這套 AI 系統不斷升級。樂乘告訴我們,作為阿里巴巴的 AI 落地應用,開放后的「魯班」將會成為一個新的商業項目,而生產海報的費用相比人工來講會降低很多。

這里面令人好奇的事情在于,作為一項將新的商業項目,海報生成的結果能否讓付費用戶滿意?每個人對于好不好看有自己的評價標準,「魯班」要靠什么來達到這一標準?為了解決這個問題,「魯班」項目選擇和清華大學建立合作,清華大學計算機系「長江學者」特聘教授、人機交互研究所所長史元春教授,目前擔任「魯班」的視覺美學評估總負責,她表示:

「美學可以牽涉到很多問題,基本的是我看到一個東西,我總體的感官和它的主題,這對人的視覺感受來說,在心理學上已經有一些可以參考的依據,而這些依據可利用已有的大量數據驗證,并且成為構造算法的依據。」

實際上這一套美學相關的判斷標準也經過阿里巴巴電商平臺大數據的不斷反饋來進行調整,清華大學在這方面的研究也會得到進一步驗證,因此從商業場景考慮,AI 設計師「魯班」已經不再是試驗性質的產品。

目前,這套系統一端將對接商家和企業,另一端則連接設計師和一些素材庫,在和樂乘的溝通中,他告訴我們,目前已經合作的包括視覺中國、花瓣等圖片庫以及方正字庫、漢儀字庫等正版字庫,因此從實用角度來看,生成的結果不會遜色于設計師,并且商家和企業也可以在使用時事先預覽結果,找到最滿意的結果再選擇付費。

不過,魯班并非要取代設計師的工作,即便目前功能如此好用,卻仍舊需要大量數據讓它成長起來,樂乘告訴我們,今天的人工智能都是基于大數據規模結構化標注數據,設計行業在不斷變化,如果沒有辦法提供新的數據,那么魯班就只能停留在過去的階段,畢竟只有人能夠主觀創造新的設計趨勢和風格,魯班的存在更多的是解決讓設計師感到繁重的體力工作。而訓練它還需要我們人類,這也是目前官方正在進行「馴鹿」計劃,讓設計師參與進來的重要原因。

在讓 AI 協助人類的這條路上,除了「魯班」系統,阿里巴巴這次還對外展示了全新的短視頻 AI 工具 Aliwood,這套工具也將會成為淘寶店家日后的重要利器。

Aliwood 是一個短視頻生成工具,它最重要的作用是通過自動分析淘寶商品詳情頁面,生成一段 20 秒內,帶有音樂、文字和圖像信息的短視頻。它的出現,可以說最大程度解決了淘寶店主商品展示的需求。

阿里巴巴達摩院自然交互體驗實驗室負責人傅利民

「我們發現在線下,一些有音樂和視頻展示的店,銷量會有 2 到 5 倍的增加,在線上,商品有音樂和視頻展示,分享率會增加 40%左右,銷售量上的提升大概時 18%左右,但淘寶目前有數十億計的商品,90%都是圖片+文字,商家要想做視頻,找專業的人做需要 2 萬左右一個,費用很高。」

阿里巴巴達摩院自然交互體驗實驗室負責人傅利民告訴我們,確立這樣的通過圖文轉短視頻的項目是基于真實需求場景來考慮的,而利用 Aliwood 這樣的工具,對于商家銷量將有很好的效果。

「純粹從時間看,如果把淘寶 20 億的商品,在一年內都生成短視頻,大概需要 50 萬的設計師,這樣是做不到的。我們萌生了這樣的想法,能夠真正幫助到商家做這樣的事情。從內容的提取,關鍵詞的抽取最后合成,包括里面的情感計算,怎么樣找到對的音樂能夠有正向情緒的延伸,最后合成在里面。」

而說到視頻,不論是我們如今每天在刷的抖音或者快手,音樂和畫面的配合都在成為影響決定算法的重要因素,音樂的使用很容易抓住用戶情感,而好的音樂來自于更強大的情感計算能力。浙大-阿里 IDEA Lab 負責人孫凌云教授告訴我們,在 Aliwood 研發的過程當中,正因為音樂的添加,讓視頻信息量一下子增加了很多,而要做出這樣的知識圖譜,浙大的研究團隊還從電影中去學習了這方面的內容。

在 Aliwood 這個工具中,音樂是通過基本元素庫和畫面相互匹配來生成的,「比如我們要剪一個服裝相關的小片子,這個過程中我們呈現的是模特的數據,下一秒有平緩的轉換,呈現得是這件衣服穿上身轉一圈的角色,這個轉換是對于音樂庫中某一中節奏或者是某一個特效有一個匹配關系。」孫教授告訴我們,但這只是一種方式,另一種方式是通過先找到合適的音樂,然后反向去組織短視頻的素材,在目前 Aliwood 這一工具中,兩種方式都在運用。

短視頻展示商品自然要比圖片更加直觀好看,而隨著網絡帶寬的加強,流量成本降低無疑讓大家在購買商品時會更青睞于商品的視頻化展示,如果說魯班要做的是讓你第一眼就看到商品,那么 Aliwood 要做的是讓你第二眼就能了解商品,對于阿里這一以電商業務為主的平臺來說,這兩個 AI 工具的推出,正式把平臺的上的數據,用更加效率化的方式展現給每一個用戶。

當然,這兩個工具目前還都只利用于阿里平臺內(不過不局限于淘寶天貓),用樂乘的說法是「阿里的平臺數據,學到的都是阿里的設計,有什么樣的數據有什么樣的智能,要用到企業設計風格的閉環,是一種數據挑戰。」我們有理由相信,隨著 AI 技術的更快速發展,我們會見到更多這樣實際的應用出現在我們身邊,而利用好這些工具,需要每一個人重新去理解人和 AI 之間的關系,正如微軟 CEO 納德拉說的那樣:

「每個人的基本需求是能夠更有效利用自己的時間,而不是讓 AI 說『讓我們來取代你。』」


最新文章

極客公園

用極客視角,追蹤你最不可錯過的科技圈。

極客之選

新鮮、有趣的硬件產品,第一時間為你呈現。

頂樓

關注前沿科技,發表最具科技的商業洞見。

兰斯第一部 博彩SG飞艇 90比分网即时比分 大胜线上娱乐 内蒙古十一选五前三位和值尾走势 新时时彩 尊尚娱乐ktv 唯美清纯美女 亚洲影视综合网日韩av 现在销售什么好赚钱 足球单双玩法技巧 网络棋牌有序大厅 羽毛球直播比分在哪看 90vs捷报比分 体彩超级大乐透 长春红灯区站街女 中国象棋的玩法和摆法