上市公司年报可读性:财务报告可读性管理层讨论与分析可读性(2001-2021年)
數(shù)據(jù)來(lái)源:自主整理
時(shí)間跨度:2001-2021年
區(qū)域范圍:滬深A(yù)股
指標(biāo)說(shuō)明:
可讀性是文本分析的重要維度。上市公司的年報(bào)文本可讀性,既可以直接作為解釋變量,來(lái)分析一系列企業(yè)行為,如李春濤老師發(fā)表在《金融研究》上的論文《年報(bào)可讀性與企業(yè)創(chuàng)新》,以此來(lái)分析企業(yè)的創(chuàng)新行為。另一方面,可讀性也可以用來(lái)作為企業(yè)信息披露質(zhì)量的代理指標(biāo)。
但是,當(dāng)前研究更多的使用單一維度來(lái)度量年報(bào)可讀性。誠(chéng)如李春濤老師所言:
現(xiàn)有衡量中文年報(bào)可讀性的指標(biāo)忽視了年報(bào)自身特有的文本屬性,即信息披露本身會(huì)包含大量的會(huì)計(jì)財(cái)務(wù)術(shù)語(yǔ),而且忽視了企業(yè)規(guī)模和復(fù)雜度導(dǎo)致的年報(bào)信息披露量的差異性。
據(jù)此,Shin, Donghyuk, et al. (2020) 使用基于word2vec神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型,構(gòu)建了一個(gè)文本可讀性指數(shù)。其原理是假設(shè)文本中句子相互獨(dú)立,并考慮句中詞匯的前后搭配順序,將文本中各個(gè)句子生成概率乘積的對(duì)數(shù)似然的均值,作為此文本的可讀性度量。
其計(jì)算公式為:
其中,Ps表示句子s生成的概率,N表示構(gòu)成文本的句子數(shù)。其值越高,表示文本中詞對(duì)搭配順序在語(yǔ)料中出現(xiàn)的頻率越高,文本越容易被理解,文本可讀性越高;反之,則表示詞對(duì)在語(yǔ)料中出現(xiàn)的頻率越低,文本越不容易被理解,文本可讀性越差.
考慮到研究需求,共有兩份數(shù)據(jù):
上市公司財(cái)務(wù)報(bào)告可讀性?(年報(bào)可讀性),2001-2021年數(shù)據(jù),因?yàn)樯鲜泄緯?huì)公布季報(bào)和年報(bào),所以是季度數(shù)據(jù)。一個(gè)上市公司一年有四個(gè)值,分別是3、6、9、12月。
上市公司管理層討論可讀性?(MD&A) ,2001-2021年數(shù)據(jù),管理層討論通常是一年一次,所以是年度數(shù)據(jù)。
參考文獻(xiàn):
[1]會(huì)芹,施先旺.年報(bào)文本信息可讀性與股價(jià)崩盤風(fēng)險(xiǎn)[J].投資研究,2022,41(07):129-148.
[2]朱丹,李靜柔,李世新.年度報(bào)告的可讀性水平、過(guò)往業(yè)績(jī)與分析師預(yù)測(cè)[J].審計(jì)與經(jīng)濟(jì)研究,2021,36(05):77-85.
[3]逯東,宋昕倍,龔祎.控股股東股權(quán)質(zhì)押與年報(bào)文本信息可讀性[J].財(cái)貿(mào)研究,2020,31(05):77-96.
[4]王海芳,姜道平,許瑩.數(shù)字化轉(zhuǎn)型能否提高信息披露質(zhì)量?——基于年報(bào)可讀性的研究[J].管理現(xiàn)代化,2022,42(02):58-65.
[5]丁亞楠,王建新.“渾水摸魚(yú)”還是“自證清白”:經(jīng)濟(jì)政策不確定性與信息披露——基于年報(bào)可讀性的探究[J].外國(guó)經(jīng)濟(jì)與管理,2021,43(11):70-85.
[6]阮睿,孫宇辰,唐悅,聶輝華.資本市場(chǎng)開(kāi)放能否提高企業(yè)信息披露質(zhì)量?——基于“滬港通”和年報(bào)文本挖掘的分析[J].金融研究,2021(02):188-206.
字段說(shuō)明:
security_code[證券代碼]:以上海證券交易所和深圳證券交易所公布的證券代碼為準(zhǔn)。
security_name[證券簡(jiǎn)稱]:以上海證券交易所和深圳證券交易所公布的公司最新證券簡(jiǎn)稱為準(zhǔn)。
rep_period[報(bào)告期間]:報(bào)告對(duì)應(yīng)會(huì)計(jì)期間截止日期,格式為“YYYY-MM-DD”。
rep_type[報(bào)告類型]:文本數(shù)據(jù)源類型。
readability[可讀性]:報(bào)告文本中句子的條件生成概率的對(duì)數(shù)均值。其值越高,表示文本中詞對(duì)搭配順序在語(yǔ)料中出現(xiàn)的頻率越高,文本可讀性越高;反之,則表示詞對(duì)在語(yǔ)料中出現(xiàn)的頻率越低,文本可讀性越差。
樣例數(shù)據(jù):
?
?
下載鏈接:https://download.csdn.net/download/li514006030/87459071
?
總結(jié)
以上是生活随笔為你收集整理的上市公司年报可读性:财务报告可读性管理层讨论与分析可读性(2001-2021年)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 巨杉TechDay回顾 | 技术人的夏天
- 下一篇: 定制Github日历库EPCalenda