訂閱
糾錯
加入自媒體

下一波人工智能將更加強大

人工智能是一個涵蓋圖像識別、自然語言處理(NLP)和機器人等多方面維度的廣泛領域。AI也在以一種有時看似瘋狂的速度發展,因此很難跟上正在發生的一切。

不出所料,許多組織轉向他們的IT供應商合作伙伴,幫助他們開發和部署AI解決方案,以最好地滿足他們的需求。大衛·埃里森是聯想公司的高級人工智能數據科學家,他的職責包括使用先進的人工智能技術為客戶組織提供解決方案,同時在內部支持聯想全球數據中心集團的整體人工智能戰略。

聯想已投入商業運營的項目包括利用卷積神經網絡從圖像中提取特征,并將其歸類為缺陷,以檢測工廠的制造缺陷。聯想還為一家賽車公司開發了一套計算機視覺系統,以決定是否應該讓特定的汽車進入維修站進行維修。

埃利森表示,今年和不久的將來,人工智能的主要趨勢包括基于計算機視覺的應用程序、用于訓練人工智能模型的數據生成和數據標記算法的開發,以及基于轉換模型的自然語言處理的快速進展。

聯想對人工智能近期主要趨勢有如下展望:

計算機視覺

在計算機視覺方面,開發人員和研究人員現在開始探索將這種能力與人工智能的其他一些領域相結合的實用方法,比如機器人技術或自動應用圖像字幕等應用的自然語言處理。據埃里森介紹,這部分是因為計算機視覺的一些基本問題已經被證明很難解決,研究人員正在尋找新的方法來解決這些問題,而不是簡單地推動研究領域向前發展。

埃里森:“我認為我們在解決一些核心的計算機視覺任務時遇到了問題,比如3D投影,當你看到一張圖片,一棟建筑的二維圖像,人類的大腦可以將其推斷成三維形狀,但機器很難做到這一點。”在這方面已經有很多研究,但這是一個尚未解決的核心問題,我認為人們會感到沮喪,會嘗試一些新東西,或者嘗試將它與其他領域相結合,找到更好的用途。

埃里森認為,這就是為什么機器人技術是目前最廣泛研究的人工智能領域之一,因為它為人們提供了一個明確的目標。他列舉的例子包括使人工智能能夠使用視覺感應在其周圍的空間中安全移動——無論是制造工廠的機械臂,還是使用人工智能導航到目的地的自動車輛。

訓練數據

熟悉人工智能的人會知道,成功訓練一個模型的關鍵因素之一是數據,這需要大量的數據。事實上,它所訓練的數據越多,就越能更好地交付你所尋求的結果。據埃里森不是,計算機視覺目前很困難,因為用于訓練模型的數據集沒有包含足夠多的樣本。例如,吉布森三維空間數據庫(Gibson Database of 3D Spaces)是一個廣泛使用的數據集,用于訓練模型在室內空間中導航,它包括572棟完整的建筑,共1447層。雖然令人印象深刻,但這不太可能是一個人工智能系統在現實世界中可能遇到的全面集合。

當物體的方向與計算機視覺模型所訓練的方向不同時,也會出現類似的問題。在被廣泛用于人工智能訓練的ImageNet數據集中,埃里森:“一把椅子只是一張椅子的照片,面對著鏡頭。如果你把椅子翻過來,電腦視覺應用程序突然就認不出它了。”

這個缺點是一個名為ObjectNet的新數據集的靈感來源,它以不同的配置顯示日常項目,例如椅子翻轉或倒置。這個訓練集被用來解決計算機視覺的一些缺點,例如不能識別方向不正常或部分模糊的物體。

但是為人工智能訓練獲取足夠大和多樣化的數據集的問題仍然存在,這導致了埃里森發現的另一個主要趨勢,即首先使用人工智能來生成數據集。

自我監督和綜合數據

數據集需要大量的人工數據標簽,因此越來越多的研究項目現在都集中在自我監督算法上,它可以獲取已經收集到的數據,并讓計算機自動給數據貼上標簽。

埃里森解釋:“一個典型的例子就是一個具有計算機視覺應用和接近傳感器機器人。計算機視覺能夠比接近傳感器看得更遠。但是當機器人向前移動時,出現在計算機視覺中的東西最終會以物體的形式出現在近距離傳感器中。”根據傳感器的數據,回溯到物體第一次被發現的時間,然后對其進行標記。

人工智能系統一旦部署就不太可能遇到這樣的問題,因此可能無法在訓練數據集中表示出來,這是開發人員面臨的另一個挑戰。然而,如果這些邊緣情況代表了真實場景,那么就需要考慮這些情況,以確保AI模型正確地處理它們。

“關鍵的例子是自動駕駛。在你的數據集中有多少次在昏暗的暴風雪中開車上山?你的數據集中不會有很多這樣的情況,所以他們本質上必須做模擬數據。”

換句話說,邊緣案例是通過使用合成數據來處理的,合成數據是使用各種方法來創建的,例如生成模型。但這也產生了一個問題,即數據科學家或開發人員如何才能確保這些合成數據準確地反映出人工智能在現實生活中會遇到什么情況。

1  2  下一頁>  
聲明: 本文系OFweek根據授權轉載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯系我們。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號

电竞投注竞彩app