訂閱
糾錯
加入自媒體

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

2019-07-31 09:01
算力智庫
關注

算力探園記

合肥,這座位于江淮之間的文化老城“廬州”,從上世紀90年代“呼應浦東開發,建設新合肥”,到“長三角副中心”,再到如今的城市地位上升至國家戰略,合肥“發展坐標”的每一次調整,都伴隨這座城市“能級”的不斷增強。

依托中科大等知名高校的人才資源,在科大訊飛領銜的中國聲谷,扎堆高新區 “量子企業一條街”,實現一億度運行的人造太陽“東方超環”等一批企業帶動下,合肥在為下一波產業革命中的競爭與合作積攢能量。以“技術驅動+應用引領”為方向,推動合肥在中國人工智能城市排名第五。現在的合肥,基本上每天誕生1戶國家高新技術企業;每天申請發明專利近90個、獲得授權13個以上;每天技術合同交易額近4000萬元。

繼武漢東湖高新之后的第二站,算力智庫前往安徽合肥的中國聲谷調研,首先探訪了其中人工智能的代表企業科大訊飛,以及人工智能數據服務公司數據堂(安徽)。了解到Ai語音的應用程度早已超出我們的想象,最新的小數據快速定制技術只需采集用戶短短幾句話就能用機器學習復刻你的聲音。另一方面,行業內也活躍著大量數據服務公司,通過最基礎的數據標注及整合服務,為人工智能產業所需的數據質量保駕護航。

你能想象讓特朗普說流利的中文嗎?Ai可以,甚至讓特朗普說一口地道川普也不是問題。Ai模擬人聲的技術現階段已經可以通過短短十句話,就能以假亂真地模擬你的聲音說出各種話,包括中英文乃至方言。

在算力智庫探訪科大訊飛(展廳)時,上來就被來自美國總統特朗普一口標準普通話來歡迎大家參觀科大訊飛給吸引住了。

其實,語音合成技術的應用可能早于你的認知,應用范圍也比你想象的更廣!

早被大規模商用的Ai語音合成已侵入你的日常生活

語音合成技術應用其實比語音識別更早,思必馳CMO龍夢竹告訴算力智庫(ID:suanlicaijing),這項技術早已在我們身邊大規模應用。

如Iphone的智能語音助手Siri,就是在真人語音的基礎上進行語音合成。如今語音合成的聲音愈發接近真人,才讓我們突然發現原來語音合成技術已經可以以假亂真。

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

Siri美式語音的聲音提供者Susan Bennett

“其實所有涉及到機器語音反饋的背后都需要以真人語音為基礎,只是以前的合成效果比較明顯,我們可以明顯判斷出是電腦合成而已。”龍夢竹說。

很多人以為地圖軟件中的林志玲、岳云鵬導航是把明星請來一句一句錄下來的,其實背后是語音合成技術。2018年很火的紀錄片《創新中國》的配音也是合成已去世的配音家李易的聲音,其背后,就是語音合成技術實現的聲音復刻。

龍夢竹表示,目前語音合成在娛樂方面的應用比較多,比如歌曲合成、明星語音復刻等。即便是去世的明星,也可以通過語音合成和Ai換臉的方式再現熒幕。2017年電影《星球大戰前傳·俠盜一號》中,已去世的女星凱麗·費雪再次以萊婭公主的形象出現在大銀幕上,感動了一眾影迷,這種模式以后還將更加常見,哪怕是再聽單田芳出新的評書,也不再是夢想。

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

《俠盜一號》中還原的萊婭公主

除了商用娛樂方面,云知聲高級研發經理王鳴對算力智庫表示,語音合成未來在大眾日常生活中的應用也可以很多可暢想的地方。

比如視覺障礙人士的閱讀幫助以及需求陪伴,不在父母身邊的孩子可以聽著父母聲音的故事入睡、工作忙碌的子女可以讓父母聽到自己的聲音、戀人可以隨時聽到彼此的聲音用來閱讀新聞、小說等讀物。

再比如語音的個性化定制,讓我們的智能音箱、手機助手、甚至游戲內的語音都可以自行定制。“就好像我們玩的游戲中的皮膚一樣,可以任意更換,甚至變成我們身邊朋友的聲音。”王鳴說。

人工智能語音可以模擬你自己的聲音,也可以替你犯罪

Ai語音合成的技術發展早已達到無需大量的數據進行學習。思必馳CMO龍夢竹向算力智庫介紹,目前業內主流的技術方向是小數據快速定制。

以前構建合成系統需要至少上千句的音庫數據作為支撐,制作音庫費時費力。現在我們僅僅使用很少的數據就可以構建出具有對應音色的合成系統。

在探訪中,算力智庫也體驗了科大訊飛此前推出的聲音復刻相關應用,用戶只需要輸入10句話,就可以復刻出自己的聲音,播報新聞、說段子、送祝福惟妙惟肖。

不過這項體驗僅限于讓機器朗讀既定的文本,每個用戶的音庫都要經過實名認證,對此,科大訊飛有自己的考量。工作人員向算力智庫表示,目前推出的語音復刻應用只是一種宣傳娛樂手段,但是一旦開放用戶權限,可能會被不法分子利用。

“當你接到一個電話,傳來你親人的聲音,向你借錢或者讓你轉賬,你信不信?”

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

記者拍攝的科大訊飛展廳

人工智能語音可以模擬你的聲音,也可以替你犯罪。尤其在大數據時代下,個人信息非常容易泄露,近兩年如Facebook、華住酒店集團等多起個人信息泄露事件讓我們愈發重視個人信息的保護,但是聲音信息的保密意識可能是我們此前從未想到過的。

前段時間剛結束的2019中國互聯網大會的防范治理電信網絡詐騙論壇上,中國傳媒大學政法學院法律系副主任鄭寧表示,技術一直以來都是雙刃劍,我們在享受技術帶來便利、新奇的同時,也會面臨技術被濫用帶來的風險。

鄭寧在論壇上總結了四種新技術結合詐騙手段的形式,其中就提到了語音合成詐騙。騙子通過騷擾電話等錄音來提取某人聲音,獲取素材后進行聲音合成,從而可以用偽造的聲音騙過對方。

另外三種詐騙方式分別為:微信語音轉發詐騙、AI換臉詐騙以及AI篩選詐騙人員系統。

通過少量數據,將合成痕跡明顯的機器語音,轉換成更加流暢自然的語音,也正是目前Ai語音合成的主攻方向,據龍夢竹介紹,現有技術不僅可以讓語音流暢自然,甚至可以通過定制加入情緒,真正達到自然模擬的狀態。

就像前段時間Ai換臉技術在網上火了之后引發的大規模討論一樣,一旦語音合成技術被大規模應用,是否會產生恐慌呢?

人工智能技術來詐騙,誰來解決?

從技術應用方角度來說,云知聲高級研發經理王鳴認為,我們在積極推進這項技術發展的同時,也需要考慮結合更多的技術手段來降低在應用層面帶來的一些技術倫理問題。

“云知聲對用戶上傳的錄音數據及用這些數據訓練的模型都加入了嚴格的使用權限管理。從技術角度來說,雖然當前語音合成算法在主觀聽感上已經可以以假亂真,但是從聲學特征上依然是有一些差異的。另外,也可以通過加入一些人耳不可感知的聲學特征‘防偽’標志,保證不影響正常用戶體驗的情況下,使合成語音可以被特定工具檢測出來,防止被惡意使用。”王鳴對算力智庫說道。

科大訊飛也表示,其企業級合作則需要經過授權,特定在媒體行業、客服行業等使用,確保這項技術不會被誤用、濫用。除了這些問題,社會上主要擔心的問題在于用戶的信息泄露。

本周末蘋果公司被爆出Siri監聽用戶語音的事件,雖然蘋果公司稱每天發送的錄音請求不到1%,而且通常只有幾秒鐘,這是為了更好的提高siri的精準性,同時為了給用戶提供更好的服務,仍然引起了大量的恐慌。

對此,安徽省大數據產業聯盟副秘書長、數據堂副總經理張子斌從產業上下游的角度,解釋了目前人工智能和大數據產業所面臨的隱私保護問題。

張子斌表示,人工智能產業鏈的上游并非AI技術公司,而是人工智能數據服務公司。人工智能企業在訓練自己的AI模型時所需要的數據可以不需要他們去自行收集和標注,而是通過人工智能數據服務公司定制相關數據,這樣大大降低了人工智能企業成本及數據安全風險,這也是數據堂的主營業務。

“從產業鏈上下游的角度來說,我們提供的所有訓練數據都是和個人信息分離的,以語音數據為例,我們提供的都是獨立語音段落的集合,背后具體的提供者信息是完全不會出現的,因此,即便在上下游環節中出現了訓練數據的泄露情況,對于語音提供者來說,不會出現任何影響。”

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

算力智庫記者探訪數據堂(左一左二為數據堂副總經理張子斌、數據堂董事吳鑫坤)

近年來,政府也一直在聯合相關企業一起尋找新技術的管理之道。2019年6月17日,國家新一代人工智能治理專業委員會發布《新一代人工智能治理原則——發展負責任的人工智能》,提出了人工智能治理的框架和行動指南。《治理原則》突出了發展負責任的人工智能這一主題,強調了和諧友好、公平公正、包容共享、尊重隱私、安全可控、共擔責任、開放協作、敏捷治理等八條原則。

在中國傳媒大學鄭寧看來,正如AI技術可以被用于詐騙,也可以被用于反詐騙。利用技術的方式不同,帶來的影響也不同。因此,在面對一項技術時,不僅要關注技術本身,更要關注技術的用途,將技術用于提高生活質量。

鄭寧表示,科技發展與人民生活是相輔相成的,科技發展使得人民生活質量有了極大的提高,因此應當大力促進科技發展。但也要認識到科技的兩面性,科技發展的同時也會產生一些負面影響,應當清楚認識并接受這一點,從而更加理性地看待科技發展,也有助于采取積極措施應對科技發展的負面影響。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號

电竞投注竞彩app