CMA研究:文本分析意义何在
文章来源:CMA官方订阅号
发布时间:2021-10-12 15:01
阅读:1009次

文本分析软件
与Tableau和Power BI等广泛使用的图形展示软件不同的是,大多数文本分析软件都是专用的。我们访谈过的组织表示,内部开发的文本分析软件可帮助他们在这个快速发展的领域取得竞争优势。【点击免费下载>>>更多CMA学习相关资料】
但这并不意味着你的公司一定要创建自己软件才能从文本分析中获益。以下会介绍两款免费文本分析软件包AntConc和RapidMiner的一些详细信息。
AntConc专门用于分析文本、找出不同的模式。和其他文本分析软件一样,使用者首先要将所有文档转换为文本文件并上传到AntConc软件。使用AntConc面临的一大挑战是,软件不支持加载词列表,而是需要逐个输入单词。例如,我们可以使用Loughran&McDonald情感词列表来比较西尔斯和塔吉特这两家公司2017年年报中与“不确定性”相关的词。以“风险”一词为例,在2017年年报中,西尔斯公司提到了24次,而塔吉特公司仅提到了14次。为了让读者了解相关背景,AntConc还给出了出现“风险”一词的句子(见图3)。
我们也对“不确定性”一词进行了分析。在西尔斯公司年报中,“不确定性”出现了7次,而塔吉特公司年报中只出现了3次。尽管这还需要做进一步的调查,但AntConc的结果显示,西尔斯公司在2017年年报中使用不确定性词的数量要远高于塔吉特公司。这可能意味着西尔斯公司舞弊的可能性更高,因此需要进一步调查。
与AntConc相比,RapidMiner更加先进。该软件包括机器学习和预测性分析,且需要以文本分析扩展来进行文本分析,包括使用Loughran&McDonald的不确定性词列表进行不确定性情感分析。
与AntConc不同的是,RapidMiner支持使用者上传词列表。我们使用RapidMiner分析了2017年西尔斯和塔吉特两家公司的会计文件,分析的是第三季度的10-Q报告(见表1)。与塔吉特公司相比,西尔斯公司使用了更多的不确定性词。西尔斯公司报告中使用最多的不确定词是“大约”,出现了74次,而塔吉特公司报告中使用最多的是“相信”,出现了9次。
虽然AntConc和RapidMiner都识别出了西尔斯公司和塔吉特公司的差异,但二者互有长短。AntConc软件更易于使用,且无需使用者下载文本分析扩展,此外,还提供句子预览,这样使用者可以看到每个词在会计文件中是如何使用的。
尽管更难操作,但RapidMiner的搜索范围更加广泛。如前所述,与AntConc一次只能搜索一个词不同,RapidMiner支持使用者加载词列表来进行多个词搜索。不过,这两个软件的分析结果类似。
文本分析意义何在
随着技术的发展,分析非结构化数据会更快、更有效,熟练进行文本分析也将成为会计师和审计师需要掌握的重要技能。非结构化数据量在不断增长,文本分析可使组织收集许多有趣又有用的信息,进而降低风险、提高绩效,并在竞争中保持优势。
简而言之,如果你是一位为高管层提供决策信息的管理会计师或财务专业人士,现在是时候学习文本分析这一增值技术了。
Diane Janvrin,博士、CMA,爱荷华州立大学黛比-杰里·艾维商学院会计学教授,IMA成员。
Ingrid Fisher,博士、CPA、CFE,纽约州立大学奥尔巴尼分校商学院会计学副教授。
李开明译,郭强校
相关阅读:【CMA:文本分析在会计和审计中的应用】
2022年CMA最新资料包领取
请大家认真填写以下信息,获取2025年CMA学习资料包,会以网盘链接的形式给到大家,点击免费领取后请尽快保存。
*姓名不能为空
*手机号错误
*验证码错误

tang

英语专业八级,雅思7.5分 毕业于华中师范大学,曾任上市公司新加坡高管翻译,总裁办助理,曾负责企业上市过程中的口笔译工作,具有多年英语教学经验。
