如今,多模態、預訓練排序堪稱是未來金融行業的主流技術方向之一。而作為一家關注前沿科技的創新型金融技術企業,度小滿早已提前布局多模態、預訓練排序,并取得了出色的成果。近期,由度小滿數據智能應用部AI-Lab撰寫的兩篇關于多模態、預訓練排序的論文,還入選了國際頂級會議。
度小滿深耕人工智能前沿技術,技術實力獲國際認可
度小滿數據智能應用部AI-Lab的兩篇論文分別入選ACM MM和CIKM國際頂級會議。兩篇論文分別就多模態和預訓練排序等多個熱門話題提出了新穎的算法,并在相關任務上達到了國際頂尖水平,獲得了審稿人的一致好評并最終錄用。這標志著度小滿在自然語言處理和計算機視覺等人工智能前沿領域的研究得到了國際同行的認可。
其中,論述具有實體對齊網格的位置增強Transformer的論文被ACM MM錄用。
據了解,許多圖像除了實際的物體和背景等信息外,通常還包含著很有價值的文本信息,這對于理解圖像場景是十分重要的。因此該論文主要研究基于文本的視覺問答任務,這項任務要求機器可以理解圖像場景并閱讀圖像中的文本來回答相應的問題。然而之前的大多數工作往往需要設計復雜的圖結構和利用人工指定的特征來構建圖像中視覺實體和文本之間的位置關系。為了直觀有效地解決這些問題,度小滿的科研人員提出了具有實體對齊網格的位置增強Transformer。
該模型能夠整合目標檢測、OCR以及基于Transformer的文本表示等多種方法的優勢,增強算法對于圖像中場景信息的理解,更精準的融合圖像與文本多模態的信息,進一步助力證件識別、人臉與活體檢測等業務場景,提升度小滿在視覺風控方面的技術能力。
度小滿加強創新技術探索,讓科技賦能金融各大場景
另外一篇基于BERT的動態多粒度排序模型的論文則被CIKM錄用。
近年來,預訓練的語言模型廣泛應用于文本的檢索排序任務中。然而,在真實場景中,用戶的行為往往受到選擇或曝光偏差的影響,這可能會導致錯誤的標簽進而引入額外噪聲。而對于不同候選文檔,以往的訓練優化目標通常使用單一粒度和靜態權重。這使得排序模型的性能更容易受到上述問題的影響。因此,在該論文中度小滿科研人員重點研究了基于BERT的文檔重排序任務,開創性地提出了動態多粒度學習方法。此外,該方法還同時考慮了文檔粒度和實例粒度來平衡候選文檔的相對關系和絕對分數。
該模型有效地提升了長文本理解與排序任務的性能,特別是其中所用到的預訓練語言模型已經成為度小滿在自然語言處理方面的基礎架構,在獲客、信貸等業務場景被廣泛地使用,為業務模型提供了更加豐富的文本表示和精準的文本特征,在保障業務穩健發展中起到了十分重要的作用。
度小滿數據智能應用部AI-Lab撰寫的兩篇論文,為業界深入研究多模態和預訓練排序提供了良好的借鑒作用。在科學技術快速發展的大環境下,加強技術研究探索,將推動金融產業創新發展。未來,有了多模態、預訓練排序等各種創新技術的加持,金融服務行業也將迎來更多變革。