◎實習記者 李詔宇  “紫東太初”是全球首個圖、文、音三模態大模型,開創性地實現了圖像、文本、語音三模態數據間的">

国产一区二区三区中文,黄网av在线,国产精品第2页,国产成人精品国内自产拍免费看

首頁  ?  新聞頻道  ?  國內新聞

“紫東太初”首次實現“以圖生音”和“以音生圖”

2022-09-19 01:19:04

來源:科技日報

  “紫東太初”首次實現“以圖生音”和“以音生圖” AI從“一專一能”邁向“多專多能”

  ◎實習記者 李詔宇

  “紫東太初”是全球首個圖、文、音三模態大模型,開創性地實現了圖像、文本、語音三模態數據間的“統一表示”與“相互生成”,實現了“以圖生音”和“以音生圖”,理解和生成能力更接近人類,為打造多模態人工智能行業應用提供創新基礎,向通用人工智能邁出了重要一步。

  近日,2022世界人工智能大會在上海舉行,由武漢人工智能研究院、中國科學院自動化研究所和華為技術有限公司聯合研發的“紫東太初”多模態大模型項目獲得了此次大會的最高獎項。“此次大會的‘智聯世界,元生無界’主題,恰好揭示了人類智能未來發展的兩大方向,智聯世界代表弱人工智能對物理世界的作用及改造,而元生無界則代表著利用人工智能技術構建元宇宙,實現虛實融合的新型世界。”中國計算機行業協會數據安全專業委員會委員、北京理工大學網絡與安全研究所所長閆懷志說。

  中國科學院自動化研究所研究員、武漢人工智能研究院院長王金橋表示,“紫東太初”是全球首個圖、文、音三模態大模型,開創性地實現了圖像、文本、語音三模態數據間的“統一表示”與“相互生成”,實現了“以圖生音”和“以音生圖”,理解和生成能力更接近人類,為打造多模態人工智能行業應用提供創新基礎,向通用人工智能邁出了重要一步。

  “紫東太初”具備部分類腦特性

  在閆懷志看來,通用人工智能旨在制造出像人類一樣思考、像人類一樣擁有全面智能、能夠從事多類型工作的機器,因此又被稱為強人工智能。目前的人工智能充其量只是承襲了人類的認知結果,遠未形成不同感官之間的、相互確定的認知能力。

  傳統的人工智能,比如大名鼎鼎的阿爾法圍棋(AlphaGo),在一些領域內已經“孤獨求敗”。不過,北京德火科技有限責任公司技術總監李巖表示,現階段許多行業內應用的人工智能技術仍處于比較初級的階段,與科幻電影中設想的各類人工智能應用還相去甚遠。

  在王金橋看來,人工智能一路發展至今,雖然取得了許多突破與進步,但仍存在三大主要局限:首先,人工智能模型的功能單一,一個模型只能解決一個任務;其次,人工智能模型的訓練依賴于大量的樣本,如果缺乏足夠的樣本支撐,訓練也就無從談起。以訓練人臉識別數據庫Webface為例,需要2.6億張圖片才能訓練出一個可用的模型;最后,人工智能模型的泛化能力差,不能應用于廣泛的應用場景。

  “我們一直以來都在追求如何解決當前人工智能‘一專一用’的問題,基于自監督學習的多模態預訓練模型是當前的一個重要發展路徑。”王金橋說。

  自監督學習指的是從大規模的無監督數據中挖掘隱含的監督信息進行訓練,從而得到對下游任務有價值的表征,相比于傳統的深度學習,是更接近人類的學習方式。

  “能否在同一個維度、同一個空間,面對不同的場景提供同一個多模態大模型,擺脫‘一專一能’,是實現人工智能通用化的基礎。”王金橋說。“紫東太初”可以將圖像、文本、語音等不同模態數據實現跨模態的統一表征和學習,突破了當前AI技術局限,具備部分類腦特性,從“一專一能”邁向“多專多能”。

  閆懷志指出:“本質上,‘以圖生音’和‘以音生圖’仍然是一種基于數據的人工智能,但它更接近于人類的理解和思考方式,因此可以被視為從弱人工智能向通用人工智能邁進的重要基礎性工作。”

  實現三模態內容的統一與重現

  曾經,“以圖生音”和“以音生圖”只是幻想,而如今的“紫東太初”卻讓這兩者成為了現實。“以圖生音”和“以音生圖”究竟是如何實現的?實現圖、文、音三模態轉化的真正關鍵以及底層邏輯是什么?

  據悉,“紫東太初”三模態間的相互轉換和生成,其核心原理是視覺、文本、語音不同模態通過各自編碼器映射到統一語義空間,然后通過多頭自注意力機制學習模態之間的語義關聯以及特征對齊,形成多模態統一知識表示;之后,再利用編碼后的多模態特征,通過解碼器分別生成文本、圖像和語音。

  王金橋表示:“通俗地說,‘紫東太初’就是將形式各不相同的三模態內容轉化為一個統一的多模態知識表示,之后再次利用這種知識表示重新生成三模態內容,以此實現‘以圖生音’和‘以音生圖’。”

  同時,王金橋還表示,“紫東太初”憑借四大突破,有效助力以多模態認知為核心的通用人工智能發展。

  具體來說,一是首次提出多層次、多任務跨模態自監督學習框架,支持從詞條級走向模態級、樣本級的三級預訓練自監督學習方式;二是首次完成弱關聯多模態數據語義統一表示,減少數據收集與清洗代價;三是首次實現多模態理解與生成任務的統一建模,支持跨模態檢索、多模態分類、語音識別、圖像生成等理解與生成任務;四是首次實現無監督超越有監督方法,基于5%—10%的數據標注,實現100%的有監督學習效果。

  打造典型人工智能行業應用

  “與單模態和圖文兩模態相比,‘紫東太初’采用圖、文、音三模態大模型,可以靈活支撐全場景的人工智能應用。”王金橋說,“‘紫東太初’還具有在無監督情況下多任務聯合學習以及不同領域數據快速遷移的強大能力。引入語音模態后的多模態預訓練模型,可實現共性圖文音語義空間表征和利用,并突破性地直接實現三模態的統一表示,對更廣泛、更多樣的下游任務提供模型基礎支撐。”

  “目前,我們已經整合了產學研用各方面的資源,打造了一系列典型的人工智能行業應用。”王金橋說。在智能制造領域,“紫東太初”可以有效降低模型訓練對于樣本數量的依賴,同時提升算法性能。

  “紫東太初”還與杭州移動共同打造了為杭州文旅代言的智能文旅虛擬人“杭小憶”。“紫東太初”的多模態對話支持南宋御街場景陶瓷、絲綢、活字印刷、特色小吃等場景化數據的增量訓練,助力南宋御街的導游、導購人工智能數字人實現語音識別、中文對話、語音交互、以音生圖等功能。

  • 相關閱讀
  • 新時代十年的偉大變革具有里程碑意義

      【光明論壇】新時代十年的偉大變革具有里程碑意義  黨的十八大以來,以習近平同志為核心的黨中央高度重視現代化經濟體系建設,堅持黨對經濟工作的全面領導,堅持以人民為中心的發展思想,統籌國內國外兩個大局...

    時間:09-19
  • 臺地震測報中心:3天內可能還有5級以上地震

      中新網9月19日電 18日臺灣花蓮縣發生6.9級地震, 據臺灣“中央社”報道,臺氣象部門地震測報中心預估接下來5天或1周左右,余震頻率會顯著下降。  地震測報中心主任陳國昌表示,主震發生3天內可能還有5級以上的...

    時間:09-19
  • 自然資源部:中國海洋經濟整體實力不斷提升 海洋產業結構不斷優化

      中新網9月19日電 9月19日,中共中央宣傳部舉行“中國這十年”系列主題新聞發布會,介紹新時代自然資源事業的發展與成就有關情況。自然資源部總工程師張占海介紹,中國海洋經濟整體實力不斷提升。2012-2021年,海...

    時間:09-19
  • 黨建引領協同發力 杭州著力提升基層治理效能

      黨建引領 協同發力   杭州著力提升基層治理效能  今年以來,浙江省杭州市著眼制約基層治理效能提升的關鍵性問題,堅持“大抓基層、重抓黨建”鮮明導向,以提升村社黨組織組織力為重點,探索開展“爭星晉位、...

    時間:09-19
  • 臺灣地震已致1死146傷 赤科山、六十石山仍多人受困

      中新網9月19日電 18日14時44分臺灣花蓮縣發生6.9級地震。據臺灣“中央社”報道,根據臺灣災害應變中心19日最新災情統計,截至19日上午8時止共造成1死、146傷,赤科山和六十石山仍有多名旅客受困,已積極搶修和協...

    時間:09-19
  • 喜迎二十大 | 上海:奮楫爭先立潮頭

      新華社上海9月18日電 題:努力把國家戰略勢能轉化為高質量發展效能,2500萬申城干部群眾以實干篤行迎接黨的二十大——  上海:奮楫爭先立潮頭  新華社記者姜微、何欣榮、楊有宗  浦江兩岸流光溢彩,東海之...

    時間:09-19
  • 講好用好新時代“大思政課”

      講好用好新時代“大思政課”(人民時評)  我們黨立志于中華民族千秋偉業,必須培養一代又一代擁護中國共產黨領導和我國社會主義制度、立志為中國特色社會主義事業奮斗終身的有用人才。思想政治理論課是落實立德...

    時間:09-19
  • 國家林草局:近十年中國為全球貢獻了四分之一的新增森林面積

      中新網9月19日電 9月19日,中共中央宣傳部舉行“中國這十年”系列主題新聞發布會,介紹新時代自然資源事業的發展與成就有關情況。國家林業和草原局副局長李春良指出,近十年中國為全球貢獻了四分之一的新增森林面...

    時間:09-19
  • 破防了!“中華大地由我們守護,請先輩們放心”

    “魂兮歸來,毋滯異鄉陵園信美,松菊清芳......”第九批在韓中國人民志愿軍烈士遺骸安葬儀式悼念詞全文一經發布很多網友表示“看哭了”烈士們的故事更是觸動戰友們的心“退役軍人向英雄致敬”“我們接過前輩的鋼槍若...

    時間:09-19
  • 貴州新增本土確診病例12例 新增本土無癥狀感染者352例

      中新網9月19日電 據貴州省衛健委網站消息,2022年9月18日0—24時:全省當日陽性并診斷為確診病例的2例(貴陽市2例)、無癥狀感染者35例(貴陽市35例)。  另有之前已隔離管控救治的陽性人員診斷為確診病例10例(貴陽...

    時間:09-19
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
主站蜘蛛池模板: 宾川县| 五家渠市| 宝坻区| 礼泉县| 织金县| 兴安盟| 康定县| 竹北市| 溆浦县| 呼图壁县| 方正县| 沅江市| 区。| 宾阳县| 双柏县| 大城县| 东兴市| 呼和浩特市| 阳谷县| 永宁县| 碌曲县| 乌拉特后旗| 额尔古纳市| 青川县| 南丰县| 昌邑市| 庆元县| 乳源| 青龙| 岫岩| 宜城市| 崇礼县| 炉霍县| 黄浦区| 忻城县| 咸丰县| 孟州市| 贵溪市| 阜南县| 临安市| 屯门区|