/蔡肖兵
大数据,难点是求真
/蔡肖兵
大数据纷繁多样,优劣掺杂,随着数据规模扩大,统计结果的真实性、准确性可能大打折扣。《大数据时代》一书的作者也不讳言,大数据本身探寻的是一种趋势,而非精准性,大数据时代需要学会接受数据的不完美。换言之,不能因为不精确而放弃大数据的应用和发展,若要无限接近统计结果的真,必须让大数据与精细的传统统计方法互补,而非两者相互替代。
对科学界来讲,大数据并不是一个全新的概念。与自然科学不同,社会化下的信息技术,让大数据进入了社会层面,被赋予更多新的含义和期待。量子基金的乔治·索罗斯提出过一个“自反性”概念,认为社会系统的参与者是有思想的,在这样的环境中,不仅观察,就连思想和信念都会影响到我们研究的对象,从而影响我们得出的结论。索罗斯的这一概念,对于大数据研究和应用也同样适用。
尽管日益成为大数据的享用者和制造者,人们还是应该保持主动性,不能被数据牵着鼻子走。
(人民日报)