今年年初,谷歌推出了一項名為“谷歌大腦”的深度學習項目,能夠把只有64個像素(8X8)的模糊圖片,變成更清晰的圖片。這項被稱為“黑科技”的技術驚艷了很多人,帶動了AI圖像學習的熱潮,也使得人們對視頻有了更多新的想象。
11月29日,第五屆中國網(wǎng)絡視聽大會在成都召開,作為中國網(wǎng)絡視音頻領域規(guī)格最高,被稱為“年度風向標”的行業(yè)盛會,本次會議以“新使命·新視界·新動能”為主題,邀請了網(wǎng)絡視聽業(yè)界和學界的領軍人物共聚一堂,共同探討中國網(wǎng)絡視聽行業(yè)的現(xiàn)在與未來等熱點話題。金山云高級副總裁、合伙人梁守星受邀出席本次會議并發(fā)表《AI,讓視頻更有溫度》的演講,對人工智能與視頻行業(yè)結合的新技術以及未來發(fā)展進行了分享。

金山云高級副總裁、合伙人梁守星在中國網(wǎng)路視聽大會現(xiàn)場演講
梁守星表示,人工智能作為一項具備高度信息識別能力的創(chuàng)新技術,已成為社會進步的主旋律,并受到越來越多行業(yè)的關注。據(jù)有關統(tǒng)計數(shù)據(jù)顯示,目前AI領域創(chuàng)業(yè)的企業(yè)中,有一半以上都專注在計算機視覺、服務機器人以及語言和自然語言處理等方面,并在不斷向電商、金融、教育、醫(yī)療等各垂直行業(yè)滲透?!癆I在自身技術迭代并向各行業(yè)滲透的過程中,一個新的富媒體時代也隨之而來,并將助力用戶體驗升級,成為視頻的終極演進?!绷菏匦茄a充道。
“AI畫質+”還原高清讓媒體“富”起來
自19世紀中葉,人們初次接觸視頻影像起,視頻技術一直在圍繞如何讓畫面更清晰、傳輸更穩(wěn)定的方向進步。進入移動互聯(lián)網(wǎng)時代后,AI技術豐富了人們對視頻的想象。它將不再扮演單一載體形式,可以與各行各業(yè)結合,以智能穿戴設備屏幕、醫(yī)療影像等各種形態(tài),幫助教育、醫(yī)療、安全行業(yè)實現(xiàn)全面升級。
不過,在AI出現(xiàn)之前,這種升級面臨較大技術難度。一方面受限于編解碼技術能力和網(wǎng)絡環(huán)境,另一方面網(wǎng)上的圖像和視頻越來越多,存儲與傳輸這些圖像和視頻的成本也就越來越高。如何在片源不清晰,或者經過壓縮后還能呈現(xiàn)出高清效果,成為大家亟需解決的問題。
梁守星表示,基于深度學習能力的超分辨率算法和畫質修復算法,可為視頻提供商和用戶大幅節(jié)省存貯成本與傳輸帶寬,化解成本壓力。目前,金山云已推出基于這兩項算法的“AI畫質+“圖像增強技術,并實現(xiàn)在移動端將高清視頻壓縮成低分辨率視頻進行傳輸。
據(jù)了解,金山云”AI畫質+”圖像增強技術能為不同分辨率、不同類型的視頻訓練出不同的模型及模型參數(shù),再通過搜索其他類似經過壓縮的高分辨率視頻圖像,尋找圖案、顏色的相似關系,進行視頻還原和修復。這樣,在接收端將低分辨率視頻還原成高清視頻時,可以做到實時進行,完全不會影響到用戶的視覺體驗。

270p視頻幀經普通的雙線性插值(左)和金山視頻云算法放大四倍的效果(右)
如果說超分辨率技術解決的是高清圖像在傳輸過程中的高成本問題,那么對那些由于硬件設施較差、網(wǎng)絡環(huán)境欠佳、拍攝時間久遠、畫面抖動等等導致畫質損傷的片源,金山視頻云則可以通過視頻修復算法進行修復,它可應對各種突發(fā)情況導致的畫質損傷,將視頻中的馬賽克,毛刺,重影,噪點等實時修復為較好的畫質,提升用戶的視頻體驗。
金山云火眼“金睛”守護網(wǎng)絡潔凈安全
視頻行業(yè)高速發(fā)展,在帶給人們豐富信息的同時,危害社會健康和安全的涉黃、暴力、詐騙等信息業(yè)蜂擁而至。如果只靠人工審核來保持網(wǎng)路環(huán)境的潔凈安全,這將是一項耗時耗力的巨大工程。
為此,金山云基于KDL深度學習算法,借助每日千萬級海量圖片庫訓練出精準AI算法模型,打造出業(yè)內領先的一站式AI內容安全監(jiān)管平臺——金山云金睛。它可提供快速智能圖像識別,支持“鑒黃”、“暴恐”、“涉政”、“廣告識別”等多種圖像智能識別服務,同時提供“直播實時AI安全監(jiān)管服務”,“短視頻AI安全審核”解決方案,準確率高達99.9%以上。人工審核萬張圖片成本要幾十元甚至上百元,而使用金山云金睛平臺只需要幾塊錢,能帶來80%以上的成本節(jié)省。
梁守星表示,移動互聯(lián)網(wǎng)視頻的最大特點是更新快,實時性強。實時性方面,金山云通過圖片、聲音、文字等多層識別監(jiān)督,可以保證監(jiān)管無死角。在準確地識別各種不合規(guī)視頻方面,金山云在強大的計算能力外,沉淀了海量圖片,目前擁有1.2億海量數(shù)據(jù)標注,并每天24小時不間斷識別。
隨著蘋果、谷歌、高通等巨頭在AI芯片領域的發(fā)力,視頻將會迎來一個高速發(fā)展階段。未來,金山云將基于深度學習能力,充分打造視頻超分辨率和視頻修復技術,滿足人們對4K視頻高清的體驗的觀看體驗追求,同時將會增強包含聲音、圖片等多層實時視頻鑒別監(jiān)控技術能力,為視頻和各行業(yè)的發(fā)展保駕護航!