X
最新发布 / NEWS

奇瑞汽金荣获世界ESG问题识别比赛冠军

发布日期:2023-09-20 浏览次数:220

近日,在IJCAI-2023联合举办的FinNLP workshop上,会议主持方在会议上分享了在金融领域多语言ESG(Environmental, Social, and Governance)问题识别任务中各个参赛队伍使用的关键技术,并现场公布各个参赛队伍的比赛成绩。奇瑞汽金的AI团队(CheryFS Team)在中文ESG问题识别任务中三个指标中均获得世界第一的成绩。

中文赛道详细榜单

在本次研讨会上,奇瑞汽金的王伟玮在现场对参赛的技术方案以及奇瑞汽金技术论文《Leveraging Contrastive Learning with BERT for ESG Issue Identification》做了详细的介绍,并现场解答了观众关心的具体技术细节以及相关问题。

FinNLP Workshop介绍

FinNLP workshop作为AI领域顶级会议IJCAI-2023的金融领域的研讨会,旨在创造一个全球性的讨论平台,专注于探索自然语言处理(NLP)在金融科技领域的应用前景。近期,财经文献的分析已经引发了人工智能领域的广泛关注。在金融界,金融科技已经崭露头角,专注于运用尖端科技改变金融活动的面貌。因此,为了桥接NLP研究与金融应用之间的鸿沟,我们倾力打造了FinNLP系列研讨会。期待通过FinNLP的努力,能把金融领域的深刻见解引领至NLP社区,同时通过FinNLP的研究人员的分享,揭示金融科技和NLP结合所面临的挑战,并设定未来的研究方向,从而拓宽跨学科研究的领域边界。值得一提的是,FinNLP已经成功地举办了四届研讨会。

参与本次大赛的主要是各大金融企业、高校及政府机构,包括富达投资、中北密歇根学院、国立卫生研究院、香港ESG、杜塞尔多夫大学、NCSOFT、金融投资公司等。其中有些机构已参与了多次比赛,而奇瑞汽金作为首次参赛的团队能在众多队伍中取得世界冠军,其背后的努力可见一斑。

多语言ESG识别任务

根据MSCI ESG评级指引,ESG相关新闻可归类为35个ESG关键问题。本次任务的挑战在于ESG问题的识别:系统需要精准理解每篇文章所涉及的ESG问题。团队选取了多语言新闻文章作为分析样本,对其进行标注。目标语言包括英语、中文和法语。在中文数据集中,团队将SASB标准中的问题并入MSCI指南。中文赛道数据集采用的是https://esg.businesstoday.com.tw 网站上抓取的新闻文章,主要涉及经济、能源、环境和公司治理等话题。该数据集是一个分类数据集,包含10个大类别,如“气候变化”、“自然资源”、“污染与浪费”、“环境机会”、“公司治理”、“公司行为”、“人力资源”、“产品责任”、“股东否决权”和“社会机会”,每个大类别下设有多个小类别,总计45个类别。其中训练集包含900条数据,验证集100条数据,测试集238条数据。

比赛难点

由于中文数据集主要是新闻文章,篇幅相对较长,平均长度约1400字,这超出了预训练模型通常的512字长度限制,给分类带来了额外的挑战。另一方面,由于训练集数据量仅为900条,且类别达45类,每类数据量偏少且存在类别不均衡的情况,这无疑增大了模型学习每个类别有效特征的难度。然而,奇瑞汽金成功地利用了MacBert1预训练模型、小样本学习和数据增强等策略,精确地训练并优化了模型,在众多参赛队伍中独占鳌头,取得了世界第一的佳绩!

未来,奇瑞汽金将始终坚持数字力量赋能,不断深化业务与科技融合,创新金融科技产品,提升运营能力,实现数字化转型升级,为万千车主带来更专注、更务实、更创新的金融服务,向“成为用户首选的汽车金融公司”的发展愿景不断迈进!

供稿:奇瑞汽金