近期有一份关于新闻业的调查报告引起了我的注意:《中国新闻业年度观察报告2014》(以下简称“报告”)称,九成以上新闻从业者月收入低于1万元,近半数新闻从业者月收入不足5000元,网络新闻工作者的平均月收入则滞留在4000元。随后“九成新闻从业者月收入不到1万”被广泛传播。 国家统计局今年5月份曾发布2013年平均工资数据,2013年,全国城镇非私营单位就业人员年平均工资为51474元,城镇私营单位就业人员年平均工资为32706元;我国人均年薪最高的行业仍是金融业,达99659元,是人均年薪最低行业农林牧渔业(25820元)的近四倍。据此看,便是在收入最高的金融业,人均月收入仍然不到1万,九成新闻从业者月入不到1万,这个“结论”或许是符合现实情形的。既然统计局显示所有行业平均月收入都不到1万,单说新闻业月入不到1万就显得矫情和多此一举了,大有哗众取宠之嫌。 细读该调查报告不难发现,其得出上述结论的调查研究过程亦是可疑的,根据其中的素材,其实很难得出上述结论,同时,其调查研究的过程也存在一些不太科学的地方,属于“结论或许正确(难以验证)、推导却有问题”之情形。 9月13日晚间,即上述消息刚刚发布的时候,我从微信“朋友圈”刷到了这条消息,当时的一个感受是:纳尼,这是真的吗?新浪的一个朋友对此点评说:这个报告绝对没有调查过隔壁鹅厂(即腾讯)。但这些都是相对局部也相对主观的判断,还不足以判断全局。 我是从中山大学传播与设计学院院长张志安先生的微博得到这份报告全文的,有兴趣的读者朋友可以打开这个链接看一看http://www.journalism.org.cn/tcjzhyst/151.html 其中显示,报告还有一个全称叫《新媒体环境下中国新闻从业者生态调查报告》,作者一共有三位,分别是张志安、张京京、林功成。 出于讨论的需要,本文暂且引述这段作者的陈述:“本次调查于2012年11月-2013年1月间进行,采用非随机抽样的方法来选取样本,样本对象主要为国内不同区域的报业集团(包括主报、子报及其网站)。首先,从地域的角度,为了覆盖全国范围,选取了四川日报报业集团、华商传媒集团、浙江日报报业集团、南方报业传媒集团4家报业集团以及中国青年报。其中,华商传媒集团的从业者分布比较特殊,其总部位于西北地区的西安,除《华商报》外,集团旗下三份子报《华商晨报》、《新文化报》和《重庆时报》分别位于沈阳、长春和重庆。由此,我们的调查样本便覆盖了华东(浙江日报报业集团)、华南(南方报业传媒集团)、西南(四川日报报业集团)、华北(中国青年报)、西北和东北(华商传媒集团)等不同区域。其次,针对每个报业集团的新闻从业者,我们均采取全样本调查,主要由集团办公室或人力资源部提供支持,由集团工作人员或项目团队成员直接将问卷发放至新闻采编人员。自2012年11月至2013年1月期间,总共发出问卷3522份,截止2013年3月底,共回收问卷2258份,剔除部分无效问卷后,共有2109份有效问卷,回收率为64.1%,有效回收率约为59.9%” 调查报告的准确度、可信度,与样本的选取以及统计方法密切相关。 先说样本。应该说,该调查的样本选取在地域的选择方面还是相对严肃的,他们选取了五个单位,兼顾了南北差异,然而,整个新闻行业有多大呢?单说报纸,目前拥有30几家报业集团,不成集团的报纸亦相当不少;这还不包括难以计数的各种大众化、小众化的杂志,以及广播电视等等。以区区几家报纸单位的样本统计,管窥报业的状况尚且挂一漏万,以之得出整个新闻业的行业调查报告,借庄子的话说,“不似稊米之在太仓乎”?此不足为代表也。 然而,报告渲染这种以局部代整体的有限结论,既在内容提要陈述样本有相当的局限性,又在调查报告的主题中冠以全行业的大格局,这并不专业,也难称妥当。 次说样本的真实性。便是在上述如此窄化的样本单位里,问卷的获取渠道也是可疑的。调查者把问卷的发放工作交给了各单位的人力部,这固然是一个简便的渠道。然而,你懂的,在很多单位,员工和人力部的关系是相当微妙的,由人力部发放问卷的调查效果,恐怕要比由没有同事、利益关系的外来调查者差不少。与其让人力部发放问卷,不如让人力部直接打印工资条——可是,未经当事人同意,这又是侵犯隐私权的。收入调查的难点和要害正在于此:如果要获取真实数据,应该要有权威的书证,否则,人们出于各种原因,少报或多报收入,都是很容易发生的。可如果拿不到真实的数据,调查也就不必做了。 这种答卷者的纠结心理,从调查者披露的素材也可以窥见。总共发放问卷3522份,回收问卷2258份,有效问卷只有2109份,回收率为64.1%,有效回收率约为59.9%。且不说那一千多名受访者为何拒绝被调查,便是两千多名有效受访者,其答卷多大程度上反映了真实情况,也很值得怀疑。 也就是说,调查团队有没有甄别答卷真实性的能力?有没有自动淘汰垃圾数据的机制?历来做收入调查都是最难做的,这涉及个人隐私,而且很难核实。君不见多少公务员天天哭穷?以哭穷来表达对提高收入的期待,是很普遍的社会现象,但哭穷的人不一定真的穷。从报告内容来看,该调查团队并没有披露他们的核实能力和核实结果,甚至他们都没有提到有可能存在的虚假数据问题,然后他们就根据上述可疑的问卷进行统计和分析了。哦,天哪。 统计调查一般分三种,一是普查,二是抽样调查,三是个案调查。抽样调查较为普遍。如果被调查的样本是采用科学的抽样方法,从总体中抽取出来的,那么调查结果就能较好地反映总体的状况。但这要求抽样的程序设计要科学,否则得出来就是一堆垃圾数据。抽样调查还分为概率抽样与非概率抽样。所谓调查,理论上都应该要概率抽样调查,而概率抽样又一般细分为简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样等,在公布数据之时,必须要说明采用哪种抽样方式。从这个专业角度来看,上述调查的程序设计确实太不严谨了。 最后,我们看其统计分析方法。调查之后是数据录入和结果分析。统计分析,多数机构对外公布的数据只有单变量统计描述,复杂一些的还有双变量统计分析等。在单变量统计分析中,可分为两大类,一是集中趋势分析,二是离中趋势分析。集中趋势分析是从一组数据中抽象出一个代表值,以代表现象的共性和一般水平。常用的测量指标有平均数、众数和中位数。常用的离中趋势测量指标有异众比率、极差、四分互差等。 该研究采用的是比较简单的单变量统计描述,只是作了一些最基本的换算,虽然还不够科学,数据的使用倒也没有什么大问题。但数据的使用没有问题,并不意味着使用得当,更不意味着据此换算出的新数据就能反映真实状况,因为如果描述不到位,语言本身就能产生歧义。比如“九成新闻从业人员月收入不到1万”,报告中指的是“有效回收样本中的九成”,但一经移用,就是一个默认的全局性概念,这固然在新闻传播中有所发生,但根本性的问题还在于报告自身早已作了上述混淆。 我读完上述调查报告的一个感受是,这篇调查报告从调查到结论,缺乏一个稳固的逻辑链。与其好大喜功自不量力做一个很宏大的难度也很大的全国性新闻行业调查,不如专门做某个报业集团的样本调查,这样反而有利于提高调查的准确度。随意性地收一些问卷,然后一头扎到答卷里面,这样做调查其实是不严谨的,只要稍微考虑一些答卷之外的问题,就不难明白这一点。 上述调查报告的唯一“价值”在于,它一经披露,就被大量转载,上升为至少传媒业人士普遍关注一个重要议题,使得行业内外再次关注行业性的生存状态。然而它的负作用是很大的,不仅仅在于使得另一些不怀好意的人士找到了抹黑新闻业的新“依据”,更在于这句“九成新闻从业人员月入不到1万”。 这句不严谨的论断至少有三个危害。1,对从业人员的加薪愿望并不利好。正如一位同行所指出的:“你们说9成不到1万,领导看后更不想加薪了”。有些单位领导看了这个甚至会给员人减薪。2,有损行业形象。九成从业者收入不过万,这是个什么行业?收入低,行业形象能好吗?3,容易误导择业。收入是吸引人才的指挥棒,把行业的收入状况描述得这么惨,给那些可能进入新闻业的人才形成了先入为主的不良印象,容易给一些人的择业造成误导。 调查、研究、做学问,可不慎乎? |