1、大数据一、现代文阅读1.阅读下面的材料,完成下面小题。材料一什么是大数据,迄今并没有公认的定义。从宏观世界角度来讲,大数据是融合物理世界、信息空间和人类社会三元世界的纽带,因为物理世界通过互联网、物联网等技术有了在信息空间中的大数据反映,而人类社会则借助人机界面、脑机界面、移动互联等手段在信息空间中产生自己的大数据映像。从信息产业角度来讲,大数据还是新一代信息技术产业的强劲推动力。相较于传统的数据,大数据具有体量大、速度快、模态多、难辨识和价值大密度低的特征。但大数据的主要难点并不在于数据量大,因为通过对计算机系统的扩展可以在一定程度上缓解数据量大带来的挑战。其实,大数据真正的挑战来自于数据类
2、型多样、要求及时响应和数据的不确定性。(摘编自程学旗等大数据系统和分析技术综述)材料二以互联网为载体的大数据,是指人们依托互联网而将自己的行为信息与人际间的互动信息以互联网能识别、分析与保存的方式所产生的海量数据。互联网中大数据的价值再造过程如下图。(摘编自章政等大数据时代的社会治理体制)材料三“神威太湖之光”,系统采用全国产处理器构建,峰值性能每秒超过 12.5 亿亿次,是世界第一的超级计算机。2017 年,共有五项基于“神威太湖之光”的应用入围国际高性能计算应用领域最高奖“戈登贝尔奖”的提名,其中两项获奖,这是中国高性能计算应用领域近年来最重大的突破。“神威太湖之光”将如何改变我们的生活?
3、“神威太湖之光有着大数据应用的天然优势。”中国工程院院士陈左宁说。超算具有强大的数据存储、检索、计算、分析能力,而现在的大数据应用与新一代人工智能密切结合,“神威太湖之光”将为二者深度融合应用提供技术支撑。“未来,国家超算无锡中心将是一所人工智能大学。”科学家张晖这样描绘未来。他说,这所大学的学生并不是人类,而是人工智能机器人。在超算的“培训”下,智能机器人将拥有独立思考的“头脑”。比如医院的 CT 机可以代替医生去诊断分析病情,通过大量数据的计算,选择最优解决方案,甚至比人做得更好。(摘编自过国忠“神威太湖之光”,入选世界互联网领先科技成果,马雪梅、顾庆赟超算,开启人工智能新时代)材料四“神
4、威太湖之光”背后的国家超级计算无锡中心,研发人员平均年龄只有 25 岁。早在 2015 年夏天,以清华大学为主的科研团队就来到无锡。这群年轻人肩负着一个重要使命,要为这款完全国产化的超级计算机打造属于自己的系统。超算团队当时的工作环境简陋,甚至连空调都没有。他们面临的挑战也是艰巨的。“机器是全新的,硬件是全新的,软件与应用都不完善,只能迎难而上。”29 岁的国家超级计算无锡中心主任助理甘霖说。当时,唯一的优势就是这支年轻的团队,快速学习与大胆尝试是团队的优势。团队里的王冬见证了“神威太湖之光”成长的整个过程:从被欧美技术封锁,到研制出完全国产芯片,再到完全国产化的超算诞生,并成为具有全世界最快
5、运算速度的计算机,最后获得国际高性能计算应用领域最高奖。王冬说,这是一个“彻底强大起来”的过程,中国的科学家们终于可以扬眉吐气了。(摘编自李超攀上世界超算最高峰,青春闪耀“太湖之光”)1.下列对材料相关内容的理解,不正确的一项是( )A.作为融合物理世界、信息空间和人类社会的纽带,大数据不但能推动新一代信息技术产业的发展,也会对其他行业的发展产生积极影响。B.人类社会借助技术手段在信息空间产生的大数据映像,有一部分经过互联网的识别、分析与保存,有可能被收集、整合,应用于生产生活。C.相较于传统数据,大数据的体量更大,但这不是目前大数据应用的主要难点,因为体量大带来的挑战可以通过扩展计算机系统得
6、到缓解。D.在互联网大数据应用中,个人、企业用户因产品或服务而产生的数据,经过云计算整合后形成大数据,反馈给各行业生产者,实现价值再造。2.下列对材料相关内容的分析和评价,不正确的两项是( )( )A.“神威太湖之光”峰值性能每秒超过 12.5 亿亿次,是目前世界第一的超级计算机,在应对数据体量大、要求及时响应等大数据应用挑战上有优势。B.两项基于“神威太湖之光”的应用获得“戈登贝尔奖”,表明我国超算研制水平和高性能计算应用能力已全面超越欧美,位居世界第一。C.未来,医院的 CT 机有可能代替医生诊断分析病情,这是因为 CT 机在超算的“培训”下会计算懂决策,将拥有能独立思考、超人的“头脑”。
7、D.国家超算无锡中心的研发人员平均年龄只有 25 岁,年轻使他们具有快速学习与大胆尝试的团队优势,使他们能克服种种困难,完成研发任务。E.超级计算机“神威太湖之光”成长的过程,也是以清华大学为主的科研团队成长的过程,这一过程体现了中国科学家自强不息的奋斗精神。3.在未来,“神威太湖之光”这一类的超级计算机将会如何改变我们的生活?请根据上述材料简要说明。2.阅读下面的文字,完成下列小题。材料一中国投资咨询网发布的2018-2022 年中大数据产业规模预测分析认为,云计算、物联网、智慧城市、移动互联,新技术与应用的不断涌现,加速了“大数据”时代的到来。统计数据显示,2016 年,全球大数据市场规模
8、为 281 亿美元,同比增长 22%。预计,2018 年全球大数据市场规模将达到 454 亿美元,未来五年(2018-2022)年均复合增长率约为15.37%,2022 年将达到 805 亿美元。2015 年,中国大数据市场规模达到 115.9 亿元,同比增长 38%;2016 年为 168.0 亿元,同比增长 45%。预计,2018 年我国大数据市场规模将达到 280 亿元,未来五年(2018-2022)年均复合增长率约为 27.29%,2022 年将达到 735 亿元。(摘编自中国投资咨询网发布的2018-2022 年中大数据产业规模预测分析)材料二2017 年全国大数据发展指数总数为 1
9、087.8,比 2016 年同期增长 179.32,各省市增长的均值为 5.78。2016 年和 2017 年 31 个省、市、自治区的大数据发展水平评估结果 2017 年国家大数据综合试验区所在区域的大数据发展总指数合计 408.36,比去年同期增长 62.26,各省市指数增幅均值为 6.23,高于全国增幅均值的 5.780。2017 年国家大数据综合试验区大数据发展水平排名 省市名称 大数据发展指数 指数增幅1 北京 63.21 5.492 广东 60.71 6.595 上海 51.87 7.3310 重庆 39.35 10.1211 贵州 38.35 3.6012 辽宁 35.19 4.
10、4113 河南 33.10 4.4115 天津 30.57 6.6817 河北 28.87 5.80(摘编自2018 年中国大数据产业发展水平评估报告)材料三2015 年 8 月,国务院印发促进大数据发展行动纲要,首次明确提出建设数据强国;2015 年 10 月,党的十八届五中全会提出“实施国家大数据战略”,将大数据上升为国家战略。2017 年 1 月,工信部发布了大数据产业发展规划(2016-2020 年)。规划具体设置了七项重点任务:一是强化大数据技术产品研发;二是深化工业大数据创新应用;三是促进行业大数据应用发展;四是加快大数据产业主体培育;五是推进大数据标准体系建设;六是完善大数据产业
11、支撑体系;七是提升大数据安全保障能力。围绕重点任务,政府还设置了大数据关键技术及产品研发与产业化、大数据服务能力提升、工业大数据创新发展、跨行业大数据应用推进、大数据产业集聚区创建、大数据重点标准研制及应用示范、大数据公共服务体系建设、大数据安全保障等八大工程,作为工作抓手重点推进。(摘编自中国投资网2018-2022 年中国大数据产业规模预测分析)材料四最近几年,美国、欧盟、日本等主要发达经济体采取各种政策举措,积极推进国家大数据战略,取得了长足进展。大数据在美国之所以能被迅速、广泛应用,与美国高度重视大数据价值、积极推动数据开放、采取各种政策举措、拥有一批掌握核心技术的信息技术企业和积极推
12、进国家大数据战略密切相关。推动大数据产业发展上升为国家战略,美国在推进大数据应用上形成了从发展战略、法律框架到行动计划的完整布局,实施四轮政策行动:注重数据开放共享和隐私保护;重视大数据重大项目研究与应用,占领大数据产业和技术制高点,以点带面引导大数据发展,通过资助重大项目研究,破解大数据发展核心技术,引导企业和社会推动大数据发展;建立高规格的领导机构,统筹和强化部门间协作,政府营造环境,充分调动企业发展大数据的积极性;强化开源社区在技术开发中的作用,打造大数据产业链的核心竞争力:多措并举,坚守大数据安全底线。(摘编自 CIO 时代网欧美等发达国家如何布局大数据战略)1.下列对材料相关内容的理
13、解,不正确的一项是( )A.2018 年我国大数据市场规模将接近 2016 年时全球大数据市场规模。B.比较大数据市场规模 2016 年同比增长率,中国是全世界的 2 倍多。C.2017 年,我国综合试验区大数据发展指数增幅超过全国其他地区。D.我国在 2015 年明确提出建设数据强国并将大数据上升为国家战略。2.下列对材料相关内容的概括和分析,不正确的两项是( )( )A.随着我国新技术与应用方面的不断涌现、大数据产业规模的扩大和发展水平的迅速,“大数据”时代会最快到来。B.依据材料二,2017 年,我国大数据发展水平居于前列的是北京和广东,大数据发展指数增幅超过 10 的是重庆。C.全国大
14、数据发展己形成了以国家大数据综合试验区为引领,多区域集聚发展、第一梯队领先优势明显的格局。D.随着大数据技术的快速发展及重要影响,我国以及世界其他经济强国的相关部门都在积极实施国家大数据战略。E.美国政府的态度决定了大数据在美国被应用的程度与水平。3.中美两国为促进大数据产业发展采取了哪些措施?请根据材料,概括说明。3.阅读下面的材料,完成下列小题。材料一早在 1980 年,未来学家阿尔文托夫勒便在第三次浪潮一书中将大数据称为“第三次科技浪潮的华彩乐章”。从 2009 年起,“大数据”逐渐成为人们争相讨论的词汇之一。如今,无论在自然科学还是在社会科学的研究项目中,都能看到大数据的身影。有学者认
15、为对不同的使用者来说,大数据的价值体现在不同的方面:对于投资人和创业者而言,大数据是热门的融资标签;对于大多数互联网公司或工程师来说,大数据意味着对一堆数据进行计算;对于消费者或者互联网用户来说,大数据是商家尽可能搜集的跟终端消费者相关的行为数据有学者认为大数据的特点主要体现在以下四个方面:第一,大数据相较于传统数据来说,最大的区别体现在数据规模上,传统的大型数据集规模一般为 TB 级别,而大数据的规模则呈千倍级的增长,从 TB 跃升至 PB。第二,大数据不再是传统的结构化数据,而是包括网络日志、视频、图片和地理位置信息等多种类型的非结构化信息。第三,大数据本身拥有海量信息,但信息必须通过分析
16、才能实现从数据到价值的转变,而真正可用的数据可能只有很小一部分。第四,大数据的采集、分析及时,流转快速,能保证大数据的新鲜和价值。为什么人们对大数据如此关注?牛津大学互联网研究院教授维克托迈尔舍恩伯格和经济学人杂志数据编辑肯尼思库克耶在其合著的畅销书大数据时代:生活、工作与思维的大变革中指出,大数据时代分析的信息量很多,在处理个别现象的数据时不用依赖随机采样。大数据的出现改变了人们的思维方式,它让人们关注相关事物之间的关系,只需知道“是什么”,而不用知道“为什么”。这颠覆了千百年来人类的思维模式,开启了一次重大的时代转型,对人类的认知方式和交流方式提出了新挑战。(取材于杨敏等相关文章)材料二大
17、数据这股浪潮正在兴起,人民大众的经济、交通、医疗、旅游、服务等方面的生活形态,都可能在互联网平台上展开。目前,大数据在电子商务领域的应用最广泛。京东通过建立 PB 级大数据平台,将每个用户在网站上的行为数据进行记录和分析,提高与用户的沟通效率,提升用户体验,实现了向不同用户展示不同内容的效果。例如,针对用户不同的属性特征、性格特点或行为习惯,在他们搜索或点击时,网站将展示符合该用户特点和偏好的商品,尽力给用户提供友好舒适的购买体验,这就能有效提高用户的购买效率,提高用户黏性。这也是为什么我们在网上购物时,页面总能很“神奇”地为我们提供最想购买的商品的原因。大数据在公共交通、打车出行等交通领域的
18、应用也已初步展开。很多人都有在寒冬户外苦苦等公交车的经历,如今出门前只需提前查询地图,就知道车辆多久能够到站。交管部门可以将实时路况与百度地图大数据对接,依托百度地图的交通大数据,为公众提供专业的城市实时交通信息;客户可根据需要自行选择,来满足个性化出行需求,提高出行效率。利用大数据,还可以通过分析预测出行交通规律,指导公交线路的设计,调整车辆派遣密度,进行车流指挥控制,以做到及时梳理拥堵,合理缓解城市交通压力。与民生福祉密切相关的健康医疗领域也在逐步应用大数据。我国部分省市正在实施病历档案数字化,以配合临床医疗数据与病人体征数据的相关分析,用于远程诊疗、医疗研发,甚至还可结合保险数据分析,用
19、于商业及公共政策制定等。北京市政府联合百度公司及其他智能设备商和服务商共同宣布推出的“北京健康云”项目,就是利用大数据技术和数据实时展示,来报告流感、手足口病、肝炎、艾滋病、肺结核等主要传染病动态,并预测未来传染病趋势。在信息技术日益渗透到企业和个人方方面面的今天,大数据将逐渐成为很多行业、企业实现其价值的最佳途径,大数据的应用也将会全面展开。(取材于王轶辰、孙博洋相关文章)材料三大数据给人们的生活带来了便利,但在大数据热中,也出现了一些伦理问题,需要我们进行冷思考,并积极应对。一是隐私泄露问题。随着大数据的广泛应用,这个世界越来越透明,人们就好像处在“鱼缸生活”中,个人的身份信息、行为信息、
20、位置信息甚至信仰、观念等隐私信息,都可能被记录、保存、呈现,每个人的信息,无一不被外界掌握。二是信息安全问题。个人所产生的数据包括主动产生的数据和被动留下的数据,其删除权、存储权、使用权、知情权等本属于个人可以自主的权利,在很多情况下难以得到保障。大数据使用的失范与误导,如大数据使用的权责问题、相关信息产品的社会责任问题等,也是信息安全问题衍生的伦理问题。三是数据鸿沟问题。一部分人能够较好占有并利用大数据资源,而另一部分人则难以占有和利用大数据资源,造成数据鸿沟。学术界普遍认为,针对大数据技术引发的伦理问题,应确立相应的伦理原则。大数据技术发展应坚持以人为本,坚持权责统一原则和尊重自主原则,数
21、据的存储、删除、使用、知情等权利应充分赋予数据产生者,还应该建立健全监管机制,消除可能引起的风险。2016 年,贵州省大数据发展应用促进条例出台,这是国内首个大数据地方性条例。大数据地方立法对国家层面立法起到了推动作用。有法律规范,大数据产业才会得到更为健康的发展,而健康发展、不断创新的大数据产业,也会带动我国的数字化高速发展。解铃还须系铃人,对于大数据技术带来的伦理问题,最有效的解决办法就是推动技术进步和技术控制。解决隐私保护和信息安全问题,需要加强事中、事后监管,但从根本上看要靠技术事前保护,所以应鼓励以技术进步消除大数据技术的负面效应,从技术层面提高数据的安全使用和管理水平。(取材于杨维
22、东等相关文章)1.根据材料一,下列对大数据特点概括不正确的一项是( )A.数据规模巨大B.数据类型多样C.数据可用度高D.数据流转性快2.根据材料一,下列对大数据理解不正确的一项是( )A.大数据从 1980 年到现在一直是人们讨论的热词。B.大数据广泛应用在自然科学与社会科学研究领域。C.大数据对不同的使用者能体现出不同的使用价值。D.大数据在处理个别现象数据时不用依赖随机采样。3.根据材料二,下列理解不正确的一项是( )A.京东 PB 级大数据平台能有效提高用户的购买效率。B.利用大数据技术可以预测在户外等公交车的时间。C.大数据能解决城市道路交通拥堵等重大城市问题。D.“北京健康云”能够
23、利用大数据预测某传染病趋势。4.根据材料二,下列关于大数据在社会生活中使用情况推断不正确的一项是( )A.某金融公司分析用户消费数据,评定用户信用等级及合理的授信额度。B.某社区根据住户情况大数据,推荐社区维修服务项目,安排维修时间。C.游客通过手机“旅游数据在线”了解景点实时信息,来帮助规划出行。D.根据地质地理条件和天气观测结果,预测某地区某时一定会发生地震。5.下列对三则材料中的字词的解说,不正确的一项是( )A.材料一的“颠覆”:“颠”字可以写成“巅”B.材料二的“福祉”:“祉”读作 zh,和“福”字同义C.材料二的“肺结核”:“肺”字一共八画D.材料三的“衍生”:“衍”是会意字,从“
24、氵”从“行”6.下列三则材料中的词语在文中的意思,解释不正确的一项是( )A.材料一的“华彩乐章”:最精彩的技术B.材料二的“用户黏性”:用户的忠诚度C.材料三的“鱼缸生活”:被束缚的、不自由的生活D.材料三的“数据鸿沟”:掌控数据能力的巨大差距7.根据材料三,下列理解不正确的一项是( )A.大数据给生活带来便利,但很多情况下人们对自己产生的数据难以自主。B.针对大数据发展热潮所带来的伦理问题,应该确立倡导相关的伦理原则。C.我国已经出台了大数据监管的地方条例,这有助于推动国家层面的立法。D.我国的数字化高速发展,必将会带动大数据产业的健康发展和不断创新。8.根据上述三则材料,简要概括大数据给
25、人们带来了哪些影响。4.阅读下面的文字,完成 13 题。大数据的一个根本缺陷就是它只关注“客观数据”的呈现,而缺少对“主观数据”的反映。从社会学角度看,所有数据说到底都是有关“人”的符号,因此,符号所蕴含的社会文化意义是我们真正需要了解和掌握的内容。如果脱离了人及其所在社会的价值本性,无限放大大数据的效应及其影响力,就可能本末倒置,最终产生许多难以预期的后果。数据来源于社会又作用于社会。无论是可以数字化的数据还是不可数字化的数据,其比较、分析和归纳其实反映的都是人在符号层面上的一种互动。大数据是汇集了行为主体、时间、地点三个维度的“数据宇宙”。在大数据时代,个人的信息更多的是以数据为载体来进行
26、互动的。如果人及其各类社会行为都仅仅被看作一个个数据符号,我们就很难从数据中解读出充满朝气、富有激情的人,也就很难从数据塑造出来的没有个性特征的人去推导群体样态和社会构成。 犹如网络一样,大数据也是一把双刃剑。巨量化的大数据在给我们研究和分析社会现象带来便利的同时,实际上也掩盖了许多具有个性特征的数据的意义。在连续的巨量数据海洋中,许多本身具有个性特征的数据已经变得无足轻重了,它们在大数据霸权面前会成为微不足道的牺牲品,大数据简化了人们对数据差异性的认知。大数据的复杂性不仅在于其数据样本巨量,更在于其多源异构、多实体和多空间之间的交互动态性。当前,只有少数人掌握处理这种复杂的巨量化大数据的技术
27、,这很容易导致“数据暴力”。从这个意义上说,防止大数据滋生出“数据暴力”是大数据发展中需要注意的问题。 从某种意义上说,大数据的价值只有在其能够被规范成为可供分析的形式之后才能最大程度地被挖掘出来。然而,在巨量的大数据面前,实际上可供规范分析的数据只是极少数,许多数据都停留在“碎片化”阶段而难以被真正挖掘和分析。对这些碎片化的数据进行清理,形成规整的结构,是大数据能够得到充分利用的根本所在。在大数据中,其研究范式重在发现而不是推论,运用大数据进行各种分析不应像传统的社会调查方法那样通过假设检验来进行推论,而应通过数据的总体归纳来达成对社会现象的总体分析。这不仅要求我们在数据清理技术、存储结构上
28、进行优化,而且要在数据采集环节尽可能地做到规范,否则就很难获得对复杂事物的系统认知。在大数据时代,我们真正需要的并不仅仅是大数据本身,而且是大数据背后所隐藏的我们想要获取的各种信息资源,而这些信息资源可能只占数据总体的万分之一甚至更少。从这个角度说,大量的信息其实都是垃圾。不仅如此,许多大数据本身就是模糊的,其中含有大量虚假和有害的内容。如果我们纯粹凭借数据来判断和分析人类行为,甚至不假思索地去利用和传播某种数据,就会导致许多误判。因此,未经前期调研论证和规范分析所获取的信息,其数据量越大可能越模糊,其得到的垃圾信息也就可能越多,这也为各种数据造假和不当传播打开了方便之门。对此,我们必须学会辨
29、识和判断数据的真实性,避免因盲目的数据崇拜造成误判,甚至迷失在大数据的洪流之中。(摘自大数据热中的冷思考有删减)1.下列关于原文内容的表述正确的一项( )A.所有数据说到底都是有关“人“的符号,所以大数据时代,个人的信息更多的是以数据为载体来进行互动的。B.大数据能反映人及其所在社会的价值本性,因此人及其各类社会行为都不能仅仅被看作一个个数据符号。C.把人及其各类社会行为变为更多的数据符号,我们就可以从数据中解读出充满朝气、富有激情的人。D.大数据时代不应该脱离了人及其所在社会的价值本性,无限放大大数据的效应及其影响力。2.下列理解和分析符合原文意思的一项( )A.大数据时代,我们真正需要的并
30、不是大数据本身,而是大数据背后所隐藏的我们想要获取的各种信息资源。B.从某种意义上说,大数据的价值只要在其能够被规范成为可供分析的形式之后就能最大程度地被挖掘出来。C.许多数据都停留在 “碎片化“阶段而难以被真正挖掘和分析,大数据的“碎片化“导致人们难以系统认知复杂事物。D.未经前期调研论证和规范分析所获取的信息,其数据量越大越模糊,其得到的垃圾信息也就可能越多。3.根据原文内容,下列说法正确的一项( )A.大数据的碎片化不仅要求我们在数据清理技术、存储结构上进行优化,而且要在数据采集环节尽可能地做到规范,才能获得对复杂事物的系统认知。B.因为只有少数人掌握处理这种复杂的巨量化大数据的技术,所
31、以许多本身具有个性特征的数据已经变得无足轻重了。C.因为有不可数字化的数据,因此尽管其比较、分析和归纳其实反映的都是人在符号层面上的一种互动,也很难从数据塑造出来有个性特征的人。D.大数据给我们研究和分析社会现象带来便利,但我们也不能盲目的崇拜数据,在大数据热中应该有冷思考。5.阅读下面的文字,完成下列小题。“大数据”无法触及诗词的本质陈慧刘慈欣的短篇小说诗云,讲述了一个外星超级智慧生命体试图用“大数据”征服中国古典诗词的故事。小说想要表达的是,技术是反诗意的,对于依赖个体心灵和内在情感的诗歌来说,技术永远无法触及诗歌的本质。日前,清华附小六年级学生用大数据分析苏轼写了论文的报道又引发众人关注
32、。这促使我们思考两个问题:将诗词作为“数据”进行检索研究是否合理?让小学生通过大数据分析进入诗词是否合适? 诗词与大数据能否相得益彰,要从二者各自的特质说起。无论从创作还是从赏析的角度,诗词都是一项主观性很强的艺术,正所谓各言其志,诗词中大多寄托着作者的情感体悟,而诗作的水准则由诗人的才性神思所决定。诗词中的意象和兴味往往只可意会,需要在读者和作者之间达成某种精神上的默契。对诗词的欣赏研究,不能一味寻章摘句,因为一首诗词首先是一个有机整体,必须营造出自洽而完整的意境。然而,大数据分析是一项纯客观的方法,是对客观数据的碎片化处理:如对苏轼全部诗词进行分词研究,再从中分析出高频词,此时苏轼的诗词是
33、以“数据”形式呈现的,仅仅是一个个语词的序列,而非气脉浑成、寄托深远的活泼泼的整体这不啻为对诗词的解构。不可否认,大数据在检索、统计、定位方面的高效便捷对研究工作确有帮助,但再先进的技术手段也不能代替对作品本身的体察涵泳,正如捷径无法代替苦功。对苏轼诗词中高频词的搜索定位,只能得出某些外在印象,无法细腻深刻地触及其内涵和义旨。小学生应该接受怎样的诗词教育?事实上,我国古代一直有绵延不绝的“诗教”传统,古典诗词的关键功能在于涵养人的性情,使之归于温厚。正如钱穆所说,文学作品中包含了作家的全部人格,它对读者的劝诫安慰如朋友兄弟般亲切。伟大的诗人修辞立其诚,吐露真性情,读者阅读其诗,不仅会为其真情感
34、动,也很容易为其人格及人生境界感动,而心向往之。小学生使用大数据固然有助于培养科学精神和逻辑思维能力,但这与诗词的教育旨趣相异。拿苏轼诗词来说,让孩子们将其看作有血有肉、丰富多彩的艺术作品,从具体作品中感受苏轼的悲欢离合、开朗豁达与家国情怀,并进一步培养起对中国传统人文精神的感知力和理解力,不是比作为大数据视野下的客观对象而得出粗浅认知,要更有意义吗?庄子天地篇中激烈地拒斥技术,认为技术的滥用会导致心灵的遮蔽。那么小学生使用大数据,有没有技术的“滥用”之嫌?这个问题姑置不论,重要的是,孩子们的蓬勃诗心不要就此遮蔽。(选自文汇报2017 年 10 月 22 日,有删改)1.下列关于原文内容的理解
35、和分析,正确的一项是( )A.用大数据可以从古典诗词中提取出人类的共同情感,有助于把握诗人的心灵和情感。B.对诗词的欣赏研究只能采取整体感知的方法,而大数据无法对数据进行整体化处理。C.大数据分析只是一项纯客观的技术方法,它无法触及诗词的内涵和义旨等本质特性。D.用大数据研究诗词只能获得理性认识,而不能与诗词内外的自然生命发生感情共鸣。2.下列对原文论证的相关分析,不正确的一项是( )A.文章第一段援引一篇小说和一则报道,提出论题,并表明了作者“反技术”的态度。B.文章通过对诗词和大数据各自特质的分析,论证了“大数据”研究诗词的不合理性。C.文章将体察涵泳与大数据分析的结果进行对比,论述了感性
36、启发对诗词教育的意义。D.文章论述两个论题之后,指出了大数据对孩子诗心的危害,回应了开头提出的疑问。3.根据原文内容,下列说法不正确的一项是( )A.用大数据来处理诗词,没有注意到诗词主观性、整体性的特质,是对美的肢解。B.诗词中的意象和兴味往往只可意会,所以读者无从感知、理解诗人的人文精神。C.大数据分析容易使学生丧失“感动”能力,因而很难真正进入诗人的情感世界。D.在诗词教育中应通过情感教育来帮助人涵养性情,塑造人格,提升人生的境界。6.阅读下面文章,完成下列小题。大数据的财富与陷阱 大数据指所涉及的数据量规模巨大,以至于无法在合理时间内通过人工截取、管理、处理并整理成为人类所能解读的信息
37、。有人把大数据的特征归纳为 4V:Volume(量大)、Variety (多样)、Velocity(高速)、Value(价值密度低)。大数据首先体现在数据量巨大上。1024 个 GB 是一个 TB,再 1024 个 TB 就是一个 PB,而大数据往往达到 PB 数量级,可见数据量大得无法想象。其次,就是数据的多样性,交易的品种、卖家的信息、买家的信息、快递的信息、支付的信息,构成了一个行业多样化的数据链。第三,就是数据产生的速度极快,检索结果的速度也要求快,要在几百万件商品中查找出一类商品,其检索速度只需要 1 秒,这是传统技术无法达到的。大数据的内容虽真实、完整地反映了客观世界,但它的价值密
38、度很低,如果不去研究挖掘,大数据是不会自动产生有用结果的。比如,在街景的海量监控视频中,犯罪分子留下的踪影也许只有几秒钟。 英国的大数据权威专家维克托迈尔舍恩伯格曾断言人类已经无可逆转地跨入了大数据时代。大数据时代在生活、工作和思维上给人们带来了巨大变革。首先,是数据的形式由原来的关系型数据更多地表现为非关系型数据;数据存储方式也由原来集中式存储变为分布式存储,大型数据不得不存储在不同地方的存储服务器中,通过网络进行互联访问,构成所谓的云存储。其次,是对数据处理的方式发生了根本变化,人们已无法只用一台电脑处理数据,必须依赖网络后面的云平台,进行云计算,才能有效处理大数据。在对大数据处理上,有三
39、个变化:在小数据时代,人们限于获取数据的困难,只能采用随机抽样的方式获取数据样本,然后根据样本数据进行分析预测。一旦样本出现偏差,那推导出的结果就会产生很大的误差。而在大数据时代,数据处理的范围是全体,而不再是样本。第二个变化,是不再一味地追求数据的精确性。由于大数据的多样性、丰富性、动态性,强调数据的精确性是做不到的,也没有必要。纷繁的数据会混杂在一起,看起来好像全无用处,甚至有些还是错误的数据,但是没有关系,这就是大数据的本性, 看似无关无用的一堆数据却蕴含着无限商机。第三个变化,是关注数据之间的相关性,而不是因果关系。比方说,通过挖掘天猫商城的交易数据,发现购买德龙咖啡机的买家,会有很高
40、的比例购买宠物粮食,那商家会不失时机地推荐你购买皇家狗粮。咖啡机与狗粮没有因果关系,但却有内在的相关性。数据之间的相关性,就是大数据所蕴含的价值,也是商家追求的商机。大数据的相关性,告诉我们在面对错综繁杂的大数据时, 我们不需要去研究“为什么”,只要知道“是什么”就足够了。 大数据时代将催生一个数据挖掘行业,出现一批数字科学家。数据挖掘就是从收集的数据中用一定的算法分析计算,得到我们所需要信息和知识的过程。传统的统计分析是将数据按已知的类别进行分类统计,然后寻找有价值的数据。数据挖掘采用的是一种叫“聚类”的方法,它事先不需要人工分类,而是由算法分析数据的属性,将数据自动聚集成“类”,使“类”间
41、的相似性尽量小,“类”内的相似性尽量大。比方说,保险业务涵盖各类人群、各种职业,所以设计某个险种潜在的客户目标群,需要对大量数据进行挖掘,才能找出不同的客户群和重要系数,这不是事先人为设定的。要“让数据自己说话”,这样才能因地制宜地制订营销计划,科学测算盈亏平衡,为保险企业创造更多利润。 (科技博览2014.7.28,有删节)1.下列关于“大数据”的表述,不正确的一项是( )A.大数据所涉及的数据量规模巨大,往往达到 P 数量级,相关信息无法在合理时间内靠人工截取、管理、处理并整理成为人们可以解读的信息。B.大数据的特征被人概括为 4V,即 Volume(量大)、Variety (多样)、Ve
42、locity(高速)、Value(价值密度低)。C.大数据具有多样性的特点,且交易品种、交易双方、物流快递、支付方式等信息,虽然呈现为碎片化状态,却能构成一个数据链。D.大数据具有速度快,内容真实等特点,完整反映了客观世界,却又有价值密度很低的特点,赖于人们对此进行研究挖掘,方能应用。2.下列对文章内容的理解和分析,不恰当的两项是( )( )A.大数据并不是现代社会特有的产物,任何时代都会产生自己的大数据。B.对所存储数据应进行控制与筛选,避免因数据过大造成的分析困难。C.如果没有相关技术与有效的分析手段支持,所谓的大数据没有价值。D.无论个人还是企业,都可以从对大数据的应用中获得极大的切实收
43、益。E.因为大企业管理严格,所以它们收集使用用户个人信息数据不会泄露。3.根据文意,请分条概括大数据具有哪些特点。7.阅读下面的文字,完成下列小题。大数据时代“大数据时代”的说法并不新鲜,早在 2010 年,美国数据科学家维克托迈尔舍恩伯格在大数据时代一书中就系统地提出,以前,一旦完成了收集数据的目的之后,数据就会被认为已经没有用处了。比如,在飞机降落之后,票价数据就没有用了;一个网络检索命令完成之后,这项指令也已进入过去时。但如今,数据已经成为一种商业资本,可以创造新的经济利益。数据能够成为一种资本,与移动互联网有密切关系。随着智能手机、平板电脑等移动数码产品的“白菜化”,WIFI 信号覆盖
44、的无孔不入,越来越多的人不再有“在线时间”和“不在线时间”之分,只要他们愿意,便可几乎 24 小时一刻不停地挂在线上;在线交易、在线支付、在线注册等网络服务的普及固然方便了用户,却也让人们更加依赖网络,依赖五花八门的网上平台。大数据时代的科技进步,让人们身上更多看似平常的东西成为“移动数据库”,如带有存储芯片的第二代银行卡、信用卡,带有芯片读取功能的新型护照、驾驶证、社保卡、图书证等等。在一些发达国家,官方为了信息录入方便,还不断将多种“移动数据库”的功能组合成一体。数字化时代使得信息搜集、归纳和分析变得越越方便,传统的随机抽样被“所有数据的汇拢”所取代,基于随机抽样而变得重要的一些属性,如抽
45、样的精确性、逻辑思辨和推理判断能力,就变得不那么重要,尽可能汇集所有数据,并根据这些数据得出趋势和结论才至为关键。简单地说,以往的思维决断模式是基于“为什么”,而在“大数据时代”,则已可直接根据“是什么”下结论,由于这样的结论剔除了个人情绪、心理动机、抽样精确性等因素的干扰,因此,将更精确,更有预见性。不过,一些学者指出,由于“大数据”理论过于依靠数据的汇集,那么一旦数据本身有问题,在“只问有什么,不问为什么”的模式下,就很可能出现“灾难性大数据”,即因为数据本身的问题,而做出错误的预测和决策。斯坦福大学专家特沃尔哈斯蒂也指出,“大数据”的理论是“在稻草堆里找一根针”,而面临的问题是“所有稻草
46、看上去都挺像那根针”。而乔治梅森大学专家瑞贝克高尔丁则提出“数据提供者造假”的危险,在“大数据时代”变得更有害,因为“大数据”理论建立在“海量数据都是事实”的基础上,但人们无法控制数据提供者和搜集者本人的偏见和筛选。由于“大数据”炙手可热,数据的流失、泄露和私下买卖也成为噩梦,全球各地不时发生的个人信息被盗,可被看作“大数据时代”对个人生活的伤害,而“维基泄密事件”则提醒强力部门和各国政府,“大数据”的魔力同样会对强者构成威胁。(国际先导报2013 年 7 月 5 日,有删节)1.下列选项中,不属于“危险大数据”的内容的一项是( )A.如果过于依靠数据的汇集,一旦数据本身有问题,就会可能导致“
47、灾难性大数据”出现。B.“所有数据的汇拢”使随机抽样中的精确性、逻辑思辨和推理判断能力变得不重要。C.“大数据”理论需要海量数据都是以事实作基础,但人们无法控制数据都是真实的。D.“大数据”一旦流失泄露和私下买卖,不但对个人生活,甚至对各国政府都会带伤害。2.根据原文提供的信息,下列对“大数据时代”的阐述,不符合原意的一项是( )A.“大数据时代”,根据“是什么”下的结论剔除了个人情绪、心理动机等因素的干扰,因此,与传统的随机抽样相比更精确,更有预见性。B.“移动互联网”提供了数据传输的网络服务,赋予了“大数据”的商业资本价值。C.带有存储芯片的第二代银行卡、信用卡、新型护照、驾驶证、社保卡、
48、图书证等固然给你带方便,但数据的流失、泄露和被人私下买卖,也可能成为你的噩梦。D.“灾难性大数据”的出现,是因为收集者不负责任地“只问有什么,不问为什么”。3.根据原文内容,下列理解和分析不正确的一项是( )A.在数字化时代,人们需要的是更精确、更有预见性的结论,数据的搜集、归纳和分析也变得方便起,因此,传统的数据抽样的准确性、逻辑思辨和推理判断能力等要素的地位有所降低。B.数据提供者提供的数据有时不够全面,搜集者有个人的偏见和筛选角度,往往导致“所有稻草看上去都挺像那根针”,以致得出的结论似是而非,好像都是正确的。C.“在稻草堆里找一根针”,就是说在“大数据”中找出自己需要的小数据,这就需要
49、使用者耐心、细致地去寻找,需要顽强的毅力。D.适应时代发展,提醒人们小心应对“大数据”时代,在数据的运用上趋利避害,这是本文作者的写作意图,也是对人们的告诫。8.阅读下面的文字,完成 13 题。工业化时代,学校教育映射了工业化集中物流的经济批量模式:铃声、班级、标准化的课堂、统一的教材、按照时间编排的流水线场景。这种教育为工业时代标准化“制造”了可用的人才。而大数据教育将呈现另外的特征:弹性学制、个性化辅导、 社区和家庭学习、每个人的成功。世界也许会因此安静许多, 而数据将火热地穿梭其中,人与人(师生、生生)的关系将通过人与技术的关系来实现,正如现在过春节拜年,不通过短信、电话、视频、微信,还能像 20 年前那样骑自行车挨家挨户拜年吗? 大数据时代,无论你是否认同技术丰富了人类的情感,技术的出现,都让我们再也回不到从前了。一个学生考试得了 78 分,这只是一个“数字”,如果把背后的因素家庭背景、努力程度、学习态度、智力水平等与 78 分联系在一起,就成了“数据”。大数据与传统的数据相比,有非结构化、数据量巨