鄂维南
日前在京举办的“中国国际大数据大会”上,中科院院士、北京大学教授鄂维南表示,中国大数据的前景非常广阔,市场非常大。但如何把这个广阔的前景变成现实,现在还面临数据质量不高、数据流通不畅、数据分析存技术问题等诸多瓶颈,“但最严重的还是人才问题”。
鄂维南指出,我国理论上说有很多数据,但当前存在“数据孤岛”现象,不同部门数据存储于不同的地方,格式也不一样,整合比较难。“大数据最高的层次就是要用数据来形成智慧,使得社会各方面可以运转起来。因此,做数据分析先要整合数据。”
“数据的质量也是一个瓶颈”,鄂维南强调,但这并不是说我们要有很完美的数据才能做分析,完美的数据永远是等不来的,做数据分析的出发点是有多少数据可以做多少事。“此外,数据的拥有方,像电信、联通,和数据分析者中间有一个很大的鸿沟,双方存在沟通障碍。”
那么,怎样才能够让数据流通起来?鄂维南介绍,目前大家想到的是数据开放,现在政府也在呼吁开放,但数据开放面临严重的隐私问题。严格来说,想靠法律办法解决隐私问题并不可能,这是数据开放面临的现实问题。
另外,现在还存在这样一种情况:即数据拥有方习惯于自己建一个团队自己来做数据分析,但实际上数据分析是一个技术活。“现在我们的数据分析公司风起云涌,什么人都可以做,没有什么技术含量,但是长远来说这条路走不通。我觉得数据行业服务最重要的是提高门槛。”鄂维南说。
“技术问题也是瓶颈。数据分析本身就是一个难题,另外中国的数据有它自身特色。”鄂维南说,从文本分析来看,我们用中文,美国用英文,两者的文本并不一样,不能完全套用国外模式。此外,我国的数据质量比较差,这个时候就需要对算法和模型进行改进。同时,数据服务作为一个业务模式,其商业模式还没有真正被认可,“数据通过什么方式赚钱,前景还不是那么清楚”。
“当然,最严重的问题是人才问题”,鄂维南指出,我国大数据发展最大的优势是市场大,最大的劣势是缺乏人才。由于大数据产业的火热,目前即使在国外,学术界跟企业界之间的人才竞争也非常激烈,在国内同样如此。并且我国目前没有非常好的培养大数据人才的机制。“本来我国教育界、科技界的人才就缺乏,而在大数据领域,统计、机械学习等相比而言更弱,所以这个问题需要引起重视。”鄂维南说。
“我个人的感觉是,我国大数据市场非常大,但要真正落到实处,要做的事情还非常多。”鄂维南说。 |