近日,人工智能顶会之一 ICLR 2024 录用结果揭晓,蚂蚁集团有 11 篇论文被收录,其中 1 篇为 Oral,3 篇为 Spotlight,7 篇为 Poster,蚂蚁集团在 AI 学术领域的进展受到关注。
(图:蚂蚁集团的《长视频中的多粒度噪声关联学习》被收录为 Oral 论文)
ICLR 组委会今年共收到了 7262 篇论文投稿,录用率约为 31%。其中,1.2% 被录用为 Oral 论文,作者获得 10 分钟的口头演讲,5% 被录用为 Spotlight 论文,获得 4 分钟的聚光灯展示;Poster 论文则以海报形式展示。论文的重要性按此三类递减。
每年,ICLR Oral 论文中一大半的论文会成为「ICLR Best Paper」,同时也代表了新一年的研究方向,今年 ICLR 评出的 Oral 论文共 85 篇,其中包括蚂蚁集团的《Multi-granularity Correspondence Learning from Noisy Instructional Videos》(长视频中的多粒度噪声关联学习)。
短视频已成为大众日常生活的主要娱乐方式,多模态技术也是当前 AI 的热门领域,由于过高的计算资源开销,现有的视频工作主要集中于片段的理解,而忽视了长视频中的时序依赖。该论文将长视频学习转化为短视频片段间的关联对齐,针对视频与文本间显著存在的噪声关联问题,提出了统一的最优传输对齐方案,显著提升了长视频理解能力并节省了时间开销。
这个方案还具有通用性,提出的噪声关联处理方法可应用于其他模态需要进行内容对齐的模型预训练学习中。
收录为 Spotlight 的 3 篇论文分别是《iTransformer: Inverted Transformers Are Effective for Time Series Forecasting》(iTransformer:倒置 Transformer 对时序预测更加有效),讲述一种新的时间序列预测工作,打破常规模型结构,在复杂时序预测任务中取得了全面领先;《Enhanced Face Recognition using Intra-class Incoherence Constraint》(利用类内不一致性约束增强的人脸识别技术),引入一个新的方法,进一步提高人脸识别的精确度。《Finite-State Autoregressive Entropy Coding for Efficient Learned Lossless Compression》(基于查找表实现的可学习自回归模型用于高效无损压缩算法),提出了一种新的算法,实现了高压缩率、高吞吐率的无损压缩。
自 2017 年以来,ICLR 每年收到的论文数量以 30% 的速度增长,其它两个人工智能顶会 NeurIPS、ICML 也是高增长。在上个月举行的 NeurlPS 上,蚂蚁集团共有 20 篇论文被收录,覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和机器学习领域的前沿主题。
(图:ICLR 自 2013 年成立以来,每年的论文数量情况。2017 年开始,论文数量攀升。)
ICLR 近年受到业内好评,主要原因是其推行的 Open Review 评审制度,所有提交的论文都会接受所有同行的评价及提问,任何学者都可匿名或实名地评价论文。而在公开评审结束后,论文作者也能够对论文进行调整和修改。
据了解,过去五年,蚂蚁集团在国际顶级学术期刊和学术会议上发表论文近 500 篇,其中 AI 领域的论文 300 余篇。蚂蚁集团在人工智能领域持续进行技术投入,基于大规模业务场景的需求,布局了包括大模型、知识图谱、运筹优化、图学习、可信 AI 等在内的技术领域。
我要评论