【48812】专为 Excel 而生!微软推出新 AI 模型网友:会计师和数据剖析师危?时间: 2024-08-03 05:00:10 | 作者: hth平台官网 |
|
发布日期:2024-08-03 05:00:10 | |
继作家、画家、程序员忧虑被 AI 替代后,微软近来最新推出的一个新的 AI 模型,可能会让会计师和数据剖析师也开端感到紧张了。
在论文中,研讨人员首要强调了电子表格在商业国际中的普遍性和重要性,指出电子表格被大范围的使用在各种使命,从简略的数据录入和剖析,到杂乱的财政建模和决议计划。可是,因为“广泛的二维网格、各种布局和多种格局选项”,导致现有的大型言语模型(LLM)很难了解电子表格的内容并对其进行推理。
为此,微软推出了 SpreadsheetLLM,想要“创始一种高效的编码办法,以此开释和优化 LLM 在电子表格上强壮的了解和推理才能”。
开始,微软研讨团队采用了一种原始的序列化办法,整合了单元格的地址、值以及格局信息。可是这种办法受限于 LLMs 的 token 约束,对大多数使用来说并不有用。未处理这一难题,微软开发了一种立异的编码结构 SheetCompressor,它可以有用紧缩电子表格,使其愈加适配 LLM 的处理需求。
从结构图中可以精确的看出,SheetCompressor 结构由三个中心模块组成:
根据结构锚点的紧缩:在整个电子表格中放置“结构锚点”,协助 LLM 了解数据结构。
微软表明,在电子表格检测使命中,SheetCompressor 大幅度的提高了处理速度和精确率:相较于原始的序列化办法,在 GPT-4 的上下文学习环境下,功能提升了 25.6%。此外,通过 SheetCompressor 微调的 LLM,即便均匀紧缩份额高达 25 倍,但 F1 得分(一种衡量二分类模型精确度的目标)仍能到达业界抢先的 78.9%,逾越同类模型 12.3%。更值得一提的是,在对各种 LLM 进行“全面评价”后,微软发现 SheetCompressor 可将电子表格编码的 token 使用量大幅度削减 96%。
不过,微软也供认现在 SpreadsheetLLM 模型仍有一些约束,如无法很好了解杂乱或结构化程度较高的数据,以及不能紧缩包括自然言语的单元格等。
但整体来说,展望未来 SpreadsheetLLM 能让更多用户更简单拜访和了解电子表格数据,还能协助自动化许多与电子表格数据剖析相关的繁琐耗时的使命,如数据整理、格局化和汇总。凭借 AI 加持下的 SpreadsheetLLM,未来企业有望节约许多时刻和资源,让职工专心于需求人类判断力和创造力的高价值活动。
扫码回复“抽奖”即有时机取得时髦 T 恤、精选图书和大会精品 PPT 等好礼~