当今时代,移动互联网打破了时间和空间的限制,在新的时空观念中,全部线上行为和越来越多的线下行为都可被记录为数据。未来,数据将呈现出爆发式增长和海量聚集的特点,成为与土地、劳动力、资本、技术等传统要素并列的新型生产要素。数据安全方面的法律也即将出台。人类社会正在从信息时代进入数据时代。
目前大数据尚没有一个权威而统一的定义。最早提出“大数据时代到来”的麦肯锡认为,大数据是一种规模大到获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和低价值密度四大特征。数据规模是衡量大、小数据的标准之一,大数据强调数据规模之“大”。大数据和小数据虽然存在规模上的差异,但是它们各有所长。数据的多元发展是大数据发展的必然趋势。
2015年1月,中共中央办公厅、国务院办公厅印发《关于加快构建现代公共文化服务体系的意见》,指出要加强公共文化大数据采集、存储和分析处理。2015年8月,国务院印发《促进大数据发展行动纲要》,将发展“教育文化大数据”列为我国公共服务大数据工程之一,指出应“加强数字图书馆、档案馆、博物馆、美术馆和文化馆等公益设施建设,构建文化传播大数据综合服务平台,传播中国文化,为社会提供文化服务”。2017年3月1日起施行的《中华人民共和国公共文化服务保障法》指出,国家统筹规划公共数字文化建设,构建标准统一、互联互通的公共数字文化服务网络。2019年8月,文化和旅游部等六部委发布的《关于促进文化和科技深度融合的指导意见》将“加强文化大数据体系建设”列为促进文化和科技深度融合的重点任务之一。2020年5月,中央文化体制改革和发展领导小组办公室印发《关于做好国家文化大数据体系建设工作的通知》,提出了文化大数据的体系架构,指出将在云端建设国家文化大数据云平台。上述政策、法律文件充分表明,通过大数据支撑、保障和推动公共文化服务建设与发展是国家发展战略的需要。 1.2 理论研究层面 目前,一些学者与机构在公共文化大数据方面进行了初步探索。李广建认为公共文化大数据研究主要包括理论研究、方法研究、技术研究、用户研究和应用研究五个部分。化柏林针对多源异构数据,设计了一套行之有效的集成架构。孙金娟提出公共文化服务大数据体系框架由主题领域、基本维度接轨和分明组配三部分组成。廖讯总结了公共文化大数据研究主题的六个方面。这些研究在公共文化大数据采集、公共文化服务大数据体系框架等方面进行了探讨,促进了公共文化大数据的发展。 1.3 实践层面 2017年成立的公共文化服务大数据应用文化部重点实验室主要在公共文化大数据系统的集成应用、公共文化服务产品的人群需求倾向与模型构建研究、公共文化数字化测评、大数据采集标准、公共文化智慧化服务与管理等方面开展了相关研究,研究课题包括“公共文化服务大数据系统的集成应用研究”“用户画像建模及公共文化精准服务研究”“大数据时代知识融合的体系架构、实现模式及实证研究”等。新版国家公共文化云作为文化馆系统的统一门户网站,突出了全民艺术普及服务功能,着重打造以看直播、享活动、学才艺、订场馆、读好书、赶大集六大功能为核心的全民艺术普及总平台。据不完全统计,截至2020年6月,国家公共文化云累计更新资源84000余条,完成与75家地方文化云的融合对接,开设地方专区75个,平台访问量达5.9亿人次。 2.1 理论研究基础相对薄弱 技术以理论研究和实践为基础。大学的大数据学科建设及理论研究尚处于起步阶段。公共文化服务机构的研究力量也较为分散。现有公共文化大数据研究成果主要反映在学术论文方面,课题数量较少,而专著几乎没有。廖讯认为,公共文化大数据研究多集中于理论分析,缺少案例和数据支撑,且同质化现象突出,介绍国外经验时缺乏国内适应性探讨,学术研究缺乏深厚的现实基础。大数据在公共文化服务领域的研究和应用相对滞后。文化大数据技术标准研究尚处于起步阶段。公共文化大数据领域的人才培养、学术研讨等有待加强。 2.2 数据基础尚未形成 大数据的发展必然要经历数据积累的过程。当前,公共文化服务机构还没有完全进入数据化建设和服务阶段,这一现状限制了文化大数据的发展。公共文化服务机构特别是文化馆,数字化建设起步较晚,拥有的数据量规模较小,离大数据规模还有相当大的差距。此外,因职能定位不同,公共文化服务机构拥有的基础数据类型也各不相同。公共文化服务机构信息共享基础设施及技术相对滞后,缺乏统一的数据建设标准和数据共享意识,没有实现跨部门数据互联互通。 同时,现阶段和未来相当一段时间大数据所追求的全面、海量数据似乎难以实现。由于个人隐私、知识产权、商业利益等问题,全面数据只能停留在学术伦理层面。从这个角度来说,大数据似乎是无限接近但是永远不能达到的状态,永远是“局部”大数据,永远也无法做到“全面”大数据。大数据的海量属性变成了极限概念。 2.3 社会效益暂未显著呈现 2013年被称为我国的“大数据元年”。大数据在我国的发展只有短短数年时间,尚处于探索阶段。现阶段,谈“大数据时代”似乎为时过早,大数据更多的是一种趋势。在国内社会实践中,有关大数据的应用并不普遍。大数据集中应用在互联网和金融领域,这得益于这些领域长期的数据积累及其在数据采集方面的便利性。在国外,公共文化领域的大数据发展较为缓慢。值得注意的是,2008年谷歌推出的流感预测系统,因出现严重偏差于2013年被迫关闭。公共文化服务要满足人民的基本文化需求,追求社会效益。然而现阶段,大数据只是公共数字文化服务的一种辅助手段,并未推动公共文化服务变革和转型。 另外,充分利用大数据并没有那么简单。大数据的强大后台是云计算、云数据中心和大数据计算平台,涉及数据采集及预处理、存储与管理、分析与数据挖掘、可视化与应用等环节。对于侧重人文社会科学的公共文化服务机构来说,涉足自然科学大数据领域,将在人才结构、人才储备、资金投入等方面面临压力和挑战。 3.1 小数据 传统意义的小数据因其数据体量及其抽样采集方式而得名。如今,小数据也包括围绕个体的全方位数据,以及与之配套的收集、处理、分析和对外交互的综合系统,是一类新兴的数据,需要采取新的应用方式才能体现其高价值的、个体的、高效率的和个性化的信息资产。已有的统计学、信息管理等学科为小数据的发展提供了深厚的理论基础。 3.2 小数据的特点 围绕个体用户所产生的小数据,与大数据相比,具有成本低、价值密度高、个性化、动态化等特点。各种移动终端、可穿戴设备的应用为小数据的采集提供了便利。对于公共文化服务机构来说,小数据是触手可得的,且小数据的挖掘没有数据“量”上的硬性要求。小数据与大数据的区别具体体现在以下三个方面。 (1)小数据体量比较小,基本采集于单一数据源,以结构化数据为主。大数据具有多元异构的特征,采集于多种数据源,涵盖了种种非结构化数据,如图片、视频、音频、日志等。 (2)小数据一般比较准确,真实性高,信息含金量高,分析成本较低。而大数据价值密度较低,需要沙里淘金,分析成本比较高,一般需要大数据技术平台支撑。 (3)小数据的研究和应用更具备可解释性。大数据涉及的维度比较多,多数情况只能研究和解决相关性问题,而不能解决因果问题。 3.3 小数据的作用 公共文化服务机构服务的对象是人,以人为本的小数据是未来数据的发力点和落脚点。小数据从微观层面反映用户的喜好、需求、个性特征等,揭示用户参与公共文化的因果关系。对个体小数据进行追踪、采集和分析,建立与用户相关的数据模型,可以精准预测个体需求和个人意愿,为个性化公共文化服务提供依据。 英国专家AnthonyLilley和PaulMoore教授提出了文化机构大数据发展的三个阶段:数据1.0阶段,只收集核心业务数据,以最简单的方式应用于市场和营销,几乎没有大数据驱动的业务决策。数据2.0阶段,文化机构注重收集在线数据(如网站访问量),但没有将其和1.0阶段收集的数据进行整合,在日常运营中极少依赖大数据决策。数据3.0阶段,文化机构以客户为中心对所有数据进行整合。基于大数据的影响力评估模式取代传统的活动和产量评估模式,数据驱动决策成为业务管理的核心手段。 公共文化服务机构在应用大数据之前需要考虑:公共文化服务机构数据从哪里来?公共文化服务机构有哪些数据?大数据在公共文化领域能做什么?哪些公共文化服务模式需要大数据支撑?现在是否有足够的数据支撑?事实上,公共文化服务机构选择什么样的数据战略,需要基于公共数字文化的现状和目标进行判断。现阶段,大数据和小数据并非对立的,二者各有所长,是相互依存的统一体。在现有数据基础上,公共文化服务机构要有机结合大数据和小数据,既要“仰望天空”布局大数据,又要“脚踏实地”用好小数据,要推动数据多元融合发展,挖掘数据要素的内在价值。这才是公共文化服务数字化转型重点关注的问题。 4.1 小数据积累、汇聚成大数据 任何数据都是从一开始收集的,大数据也不是一蹴而就的,再大的数据也是一点一滴积累而成的。其实,大、小数据之间并没有严格的分界线。从某种意义上讲,达不到全面、海量的大数据就是小数据。大数据以小数据的积累为基础。 小数据在公共文化各领域经过一定时间的积累,不仅可以使公共文化服务更加均等化、便利化,而且能有效增强用户黏性,提升公共文化服务效能。但是,小数据不能打破公共文化数据孤岛问题。随着时间的发展,公共文化服务机构各自积累的小数据体量会越来越大,这自然会产生“跨界融合”的数据诉求,数据孤岛最终会汇聚成一片数据的海洋。 4.2 大数据体现规律,小数据蕴含智慧 大数据主要对公共文化行业数据进行分析与挖掘应用,侧重整体性和规律性,同时注重广度,可以对已有的信息进行大局预测。小数据更多地以具体的业务模式为核心,关注个体行为与事实,注重深度,能够更为精准地实现需求分析,为服务决策与发展提供价值参考。无论是大数据还是小数据,都要充分发挥各自的长处,以应用而非技术为导向,精准定位遇到的行业业务问题。大数据面向数据,部分全覆盖,实时敏感,数据源存在偏差。小数据面向个体需求,真实性高,关联度高,实践性强。大数据要重点用于捕获规律,小数据要侧重匹配场景,如此才能实现精准预测与智能决策分析。 数据融合发展可以通过小数据的收集得到大数据的样本,然后用大数据分析得到宏观规律,再用小数据微观修正大数据未考虑的个体差异问题。现阶段,按照从小数据到大数据的迭代方式,应先利用小数据,再应用大数据,然后再从大数据的应用中回到小数据,反复迭代,以促使大数据成功落地。 4.3 实现个性化服务创新 在公共文化服务中,结合大数据得出的规律,利用小数据去匹配个人,将会是一种更加有效的数据运用方式。要建立开放、共享的大数据平台,收集数据信息。一方面,要利用大数据对多维度数据信息进行挖掘分析,建立维度完整的用户画像,把握用户个性化服务需求。另一方面,要利用小数据为公共文化服务进行精准定位,深度提升用户黏性,围绕特定对象需求提供更加精准的个性化公共文化服务。 以大兼小、小中见大是认识论,抓大放小、以小带大是方法论。在当今数据时代,大数据可以提高我国公共文化事业整体运行效能,更好地推进标准化、均等化和精准化发展。在公共文化领域,重视大数据的同时不能忽略小数据的价值。大数据和小数据各有所长,只有大、小数据融合发展,实现用数据说话,用数据决策,用数据管理,用数据创新公共文化服务方式、提升公共文化服务效能,才能推动公共文化迈向全新发展阶段。
1.1 政策层面
包括大数据在内的任何技术在应用领域都有其适用场景及应用基础。笔者在这里谈公共文化大数据的局限性和面临的挑战,并非是要否定其价值与方向。相反,只有充分认识其现状、特点和优劣势,才能更加有效地对其进行采集、加工、应用和挖掘。
数据呈现的是一种过程、状态或者结果的记录,这种记录数字化后可以被计算机存储和处理。数据代表某种特定信息,通过数据挖掘和分析获得价值。在大数据炙手可热的时代,公共文化服务机构纷纷引入和拥抱大数据,然而小数据对于公共文化服务机构的价值同样不可忽视。