2021-2022学年浙教版(2019版)高中信息技术必修一全册知识点梳理

上传人:花*** 文档编号:200913 上传时间:2021-11-22 格式:DOCX 页数:27 大小:10.43MB
下载 相关 举报
2021-2022学年浙教版(2019版)高中信息技术必修一全册知识点梳理_第1页
第1页 / 共27页
2021-2022学年浙教版(2019版)高中信息技术必修一全册知识点梳理_第2页
第2页 / 共27页
2021-2022学年浙教版(2019版)高中信息技术必修一全册知识点梳理_第3页
第3页 / 共27页
2021-2022学年浙教版(2019版)高中信息技术必修一全册知识点梳理_第4页
第4页 / 共27页
2021-2022学年浙教版(2019版)高中信息技术必修一全册知识点梳理_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、20212021 年浙教版(年浙教版(20192019)高中信息技术必修一知识点梳理)高中信息技术必修一知识点梳理 第一章第一章 数据与信息数据与信息 1. 数据是对客观事物的符号表示,如图形符号、 数字、 字母等。其中,数字是最简单的一种数据,是对数据的一种传统和狭义的理解。 2. 在计算机科学中, 数据是指所有能输入到计算机并被计算机程序处理的符号总称, 是用于输入到计算机中进行处理, 具有一定意义的数字、 字母、 符号和模拟量等的通称 3. 信息自古就有,人类的生活一直与信息密切相关。 4. 信息是用来消除随机不确定的东西。 5. 信息是不能独立存在的,必须依附于一定的载体。如果存储信息

2、的载体遭到破坏,那么其承载的信息就会消失 6. 信息具有载体依附性、时效性、共享性、可加工处理性、真伪性、价值性 7. 知识是人类在社会实践中所获得的认识和经验的总和, 也是人类在实践中认识客观世界(包括人类自身)的成果 8. 知识是可以继承和传递的。 9. 信息是数据经过储存、分析及解释后所产生的意义,通常是在某一特定情境脉络下的具体呈现。 10. 智慧是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力, 以及对事物发展的前瞻性看法。 11. 传感器是一种能感受被测撮并按照一定的规律转换成可用输出信号的器件或装置, 通常由敏感元件和转换元件组成。 12. 信息可用模拟信号或

3、数字信号表达。模拟信号以连续变化的物理量存在,模拟信号经过采样量化后可以得到数字信号。数字信号在取值上是离散的、不连续的信号,在信息技术中,这种信号表示的数据是 指可被计算机存储、处理的二进制数据。模拟信号与数字信号可相互转换,如将语音通过计算机的麦克风、声卡等设备存储在 计算机中,这一过程实现了模拟信号转换成数字信号,其中用到的主要设备是模数转换器 (ADC)。模拟信号与数字信号可以相互转换,将模拟信号转换成数字信号的过程称为数字化,自然界中存在的都是模拟信号,计算机中存在的都是数字信号。 13. 将模拟信号转换成数字信号一般需要经过采样、 量化与编码。 14. 采样是将信号从连续的区域(空

4、间)域上的模拟信号转换到离散时间(信号)域上的离散信号的过程,通过采样器实现。采样的间隔时间越小,采集到的样本数量就越多,声音保真率越高、容量越大 15. 量化是指将信号的连续取值近似为有限个离散值的过程。 16. 数据在计算机内部是以二进制方式进行存储和处理的。 17. 在信息技术中, 人们通常采用二进制、 八进制、 十进制、 十六进制来表示信息。 18. 任何一种进制都包含两个基本要素:基和权 19. 为了区别各种进位制的数码, 通常用一个下标来表示该数的进制(十进制数可以省略) , 也可以在该数的最后以字母来表示, 见表 1.1。 进制位 二 十 十六 八 标识 B D H O 表 1.

5、1 20. 二进制二进制 由两个基本数码:0, 1。采用逢二进一的进位规则。 21. 十六进制十六进制 由十六个基本数码组成 即 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F 22. 二进制、八进制、十进制、十六进制关系如表 1.2 十进制 二进制 八进制 十六进制 0 0 0 0 1 1 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 A 11 1011 13 B 12 1100 14 C 13 1101 15 D 14 1110

6、 16 E 15 1111 17 F 表 1.2 23. 进制转换 十进制转 R 进制(R 为任一一种进制)采用除 R 取余,R 进制转十进制采用按权相加法。 24. 十进制转十六进制:十进制转十六进制: 例如 十进制 170 转换为十六进制:采用短除法,最后将余数倒着连起来。得到结果 AA 25. 十进制转二进制:十进制转二进制: 例如十进制 17 转换为二进制:采用短除法,最后将余数倒着连起来。得到结果 10001 26. 二进制转十进制:二进制转十进制: 例如二进制 1010111 转换为十进制: 采用按权相加法, 把每一位数乘以他的权值最后相加得到十进制数得到结果:87 27. 十六进

7、制转十进制:十六进制转十进制: 例如十六进制数 123ABC 转换为十进制数:采用按权相加法,把每一位数乘以他的权值最后相加得到十进制数得到结果:1194684 28. 编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程。解码是编码的逆过程。 29. 计算机对信息进行存储、计算机对信息进行存储、 加工、加工、 传递等处理,传递等处理, 实际上是对信息的载体一数据进行处理实际上是对信息的载体一数据进行处理。数据的表现形式可以是文本、 图形、 图像、声音、 视频等, 但不管是哪种形式的数据, 最终存储在计算机中的都是经过一定规则编码后的二进制数字存储在计算机中的都是经过一定规则编码后的

8、二进制数字。 30. 常见的字符编码有 ASCII、 Unicode 及各种汉字编码。 31. 基本的基本的 ASCII 码共有码共有 128 个,个, 用用 l 个字节中的低个字节中的低 7 位编码。二进制范围为位编码。二进制范围为 00000000,.,01111111, 即十六进制的即十六进制的 007F。 32. 计算机中的汉字也是采用二进制进行编码的。汉字编码分为外码、 交换码、 机内码和 字形码。其中, 外码也叫输入码, 是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、 五笔字形码等。 33. 每 一个汉字都有确定的二进制代码, 在计算机内部汉字代码都用机内码, 在

9、磁盘上记录汉字代码也使用机内码. 34. 条形码(barcode)是将宽度不等的多个 黑条和白条, 按照一定的编码规则排列, 用以表达一组信息的图形标识符。我国普遍采用的我国普遍采用的 EAN13 条形码条形码。 35. Base64 编码是计算机中常见的一种编码方式, 规则是把 3 个字节 (24 位) 的数据按 6 位1 组分成 4 组 (24+ 6=4), 然后将每组数据分别转换为十进制, 将这些十进制数所对应的字符连接, 即为 Base64 编码。如下图 图 1.1 36. 二维条码二维码(2-dimensional bar code)是用某种特定的几何图形按一定规律在平面上(二维方向

10、)分布的黑白相间的图形记录数据符号信息。相对于一维的条形码, 二维码的信息存储蜇更大,功能也更加强大。 37. 不随意扫描非官方的二维码或安装未经验证的应用,是信息社会的基本常识。 38. 将模拟声音数字化需要经过采样、量化、编码三个过程。 39. 音频信号数字化过程中,声音的保真度不仅受到采样频率的影响,也依赖于量化值。量化值一般用二进制数表示,其二进制位数决定了量化的精度,也称作量化位数。量化位数越大,量化精度也越高。 40. Wave 格式格式音频文件的存储容量可以通过下面的公式进行计算: 存储容存储容量量采样频率采样频率(Hz)x 量化位数量化位数(bit)X 声道数声道数 x 时长时

11、长(s)(单位:位)(单位:位) 41. 其他压缩后的音频文件(mp3、aac)等容量计算公式: 存储容存储容量量采样频率采样频率(Hz)x 量化位数量化位数(bit)X 声道数声道数 x 时长时长(s) x 压缩比压缩比(单位:位)(单位:位) 42. 数字图像包括矢量图形与位图图像。 43. 矢量图形保存的文件大小一般比位图要小,并且文件大小与图形的大小无关,在图像处理软件中任意放大矢量图形,不会失真。 44. 位图图像又称栅格图或点阵图,像素是组成位图 图像的基本单位。点越多,图像越真实, 越能体现细节,同时也需要更多的存储空间。位图放大后会失真 45. 图像的量化是指要使用多大范围的数

12、值来表示图像采样之后每个像素的颜色信息。 一般用二进制数来表示其长度也称为颜色的位深度。如 256 种颜色的图像,它的位深度为 8 位。 46. 图像容量计算(BMP 格式) : 存储容存储容量量总像素总像素(水平像素(水平像素*垂直像素)垂直像素)x 颜色位深度(单位:位)颜色位深度(单位:位) 47. 静态的图像连续播放就形成视频。PAL 制式的视频每秒播放 25 帧图像, 而 NTSC 制式的视频每秒播放 30 帧图像。 48. 数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、 处理和应用的过程。 49. 计算机数据的管理巳经经历了人工管理、 文件管理和数据库管理三个阶段。

13、50. 日常使用的计算机中, 数据一般以文件的形式存储。 根据编码规则的不同,文件的格式也不相同, 用以区分不同类型的存储数据, 如文本、 图像、 音频等。 51. 结构化数据,也称作行数据,是由二维表结构来进行逻辑表达和实现的数据。 52. 非结构化数据, 是数据结构不规则或不完整, 没有预定义的数据模型, 是不方便用数据库 二维逻辑表来表现的数据。 53. 半结构化数据,就是介于结构化数据和非结构化数据之间的数据,具有一定的结构性。 54. 威胁数据安全的因素有很多, 如硬盘驱动器损坏、 操作失误、 黑客入侵、 感染计算 机病毒、遭受自然灾害等,都有可能造成计算机中数据的损坏。 55. 数

14、据存储在特定的介质上,保护数据的安全也需要保护存储数据的介质。 56. 对于政府和企业的数据, 目前主要采用主动防护的手段, 如通过磁盘阵列、 数据备份、 异地容灾等手段, 保证数据的安全。 57. 常见的数据校验方法有 MD5、 CRC、 SHA-1 等。 58. 容灾系统是指在相隔较远的异地, 建立两套或多套功能相同的 IT 系统, 互相之间可以进行健康状态监视和功能切换, 当一 处系统因意外(如火灾、 地震等)停止工作时, 整个应用系统可以切换到另 一处,使得该系统可以继续正常工作。 59. 数据概念的数据一般具有数据规模大、 处理速度快、 数据类型多、 价值密度低四个特征, 可以用 4

15、 个 V 来概括, 即数瘟 (Volume)、速度 (Velocity)、多样(Variety) 和价值 (Value)。 第二章第二章 算法与问题解决算法与问题解决 1. 算法可以帮助算法执行者高效地解决问题。 2. 算法指的是解决问题或完成任务的一系列步骤。 3. 根据算法的定义,算法具有下列特征:有穷性、可行性、确定性、0 个或多个输入、一个或多个输出。 4. 算法三要素 数据、运算及控制转移 5. 常见的算法描述方式有自然语言、流程图、伪代码、计算机程序设计语言等。 6. 流程图用一些图形符号表示规定的操作, 并用带箭头的流程线连接这些图形符号, 表示操作进行方向。 流程图描述算法结构

16、清晰、 寓意明确。 常用的流程图基本图形及其功能 如图 2.1 所示。 图 2.1 7. 计算机程序设计语言经历了“机器语言一汇编语言一高级语言”的发展历程。 8. 常见的高级语言有 Basic、 C、C+、Java、Python、Ruby 等。 9. 算法的控制结构有三种,即顺序结构、分支结构和循环结构。 10. 顺序结构指的是算法中各个步骤按照先后顺序依次执行的结构。 11. 先进行条件判断,再根据判断结果分别执行不同处理的控制结构就称为分支结构(也称选择结构) 12. 算法执行过程中, 在条件控制下, 某些操作步骤需要重复执行(循环) 的控制结构称为循环结构。 13. 循环结构的重复执行

17、(循环)并不是没有限制,没有限制就变成死循环了。 14. 用计算机解决问题时,由于实际问题情境的复杂性,需要先对实际问题进行抽象与建模,再根据建立的计算模型设计算法,并将算法用合适的方式加以准确描述。 15. 常见算法:枚举算法、解析算法、排序算法、查找算法、递归算法 16. 常见的数据结构:叉树、链表、队列、栈 17. 算法好坏衡量指标:同一问题可用不同算法解决,而一个算法的质量优劣将影响到算法乃至程序的效率。算法分析的目的在于选择合适算法和改进算法。一个算法的评价主要从时间复杂度和空间复杂度来考虑。 18.时间复杂度: 算法的时间复杂度是指执行算法所需要的计算工作量。 一般来说,计算机算法

18、是问题规模的函数,算法的时间复杂度也因此记做: 因此,问题的规模 n 越大,算法执行的时间的增长率与 f(n)的增长率正相关,称作渐进时间复杂度(Asymptotic Time Complexity) 。 19.算法的空间复杂度是指算法需要消耗的内存空间。 其计算和表示方法与时间复杂度类似,一般都用复杂度的渐近性来表示。同时间复杂度相比,空间复杂度的分析要简单得多。 第三章第三章 算法程序实现算法程序实现 1. Python 是一种面向对象、 解释型的计算机程序设计高级语言,其语法简洁清晰,方便对数据进行组织和处理 2. 使用 Python 语言编程解决问题时,需要严格遵守 Python 语言

19、的语法规则,并选择合理的程序运行环境运行程序。 3. 用于编写 Python 程序的 IDE 较多, 如 IDLE、 Spyder、 Wing、 PyCharm 等。 4. 数据按照其本身特征可以分为若干种不同的类型, 常见的 Python 基本数据类型如图 3.1 所示 图 3.1 5.5. Python 的基本运算包括算术运算(图的基本运算包括算术运算(图 3.23.2) 、关系运算(图) 、关系运算(图 3.33.3)和)和逻辑运算(图逻辑运算(图 3.43.4)三大类。)三大类。 6.6. Python 中的算术运算存在着优先级顺序,中的算术运算存在着优先级顺序, 优先程度最高级别为优

20、先程度最高级别为 1,级别数字越大,级别数字越大, 优先级越低。在同一个表达式中,优先级越低。在同一个表达式中, 如果有一个及以如果有一个及以上的运算符,上的运算符, 那么先执行优先级高的运算,那么先执行优先级高的运算, 同优先级的基本运算按同优先级的基本运算按照自左向右的顺序执行照自左向右的顺序执行 图 3.2 7. 关系运算符中 in 运算符用来检查一个值是否包含在指定的序列中, 例如 “a” in “aaa”为 True,”b” in “aaa”为 false。 图 3.3(关系运算符) 8.8. 逻辑运算符经常用于描述复杂情况的判断。逻辑运算符经常用于描述复杂情况的判断。 图 3.4(

21、逻辑运算符) 9.9. 程序设计时,程序设计时, 有些数据是未知或可变的,有些数据是未知或可变的, 为了更灵活地使用这些为了更灵活地使用这些数据,数据, 可以使用变量来存储。为了能对变量进行访问,可以使用变量来存储。为了能对变量进行访问, 需要对变量需要对变量进行命名。进行命名。 10. 变量命名要求:1.不能是数字开头、2.不能是系统关键字、3.不能重复、4.不能有特殊字符(下划线_除外)。 11. 字符串(String)和列表(List):字符串、 列表中的元素都是通过索引来定位的。如图 3.5 所示, 第一个元素的索引 是 0, 第二个元素的索引是 1, 以此类推不断递增(图 3.5)

22、。 图 3.5 12. 字符串或列表中的元素可以通过索引进行访问,如图 3.6 所示: 图 3.6 13. 字典和列表类似, 可包含多个元素。字典中的每个元素包含两部分内容:键和值。键通常用字符串或数值来表示, 值可以是任意类型的数据。键和值两者一一对应, 且每个键只能对应一个值。 14. 键和值在字典中以成对的形式出现, 并以如下方式标记: d=keyl :valuel,key2:value2, 。键值对用冒号分隔, 各个对之间用逗号分隔, 所有这些都包括在花括号 “ 中。 字典中的元素是没有顺序的, 引用元素时以键为索引。 15.15. 注释:注释:注释就是对代码的解释和说明,其目的是让人

23、们能够更加轻松地了解代码。注释是编写程序时,写程序的人给一个语句、程序段、函数等的解释或提示,能提高程序代码的可读性。注释只是为了提高可读性,不会被计算机编注释只是为了提高可读性,不会被计算机编译。译。PythonPython 中注释标识符为中注释标识符为 # #,例图,例图 3.73.7 图 3.7 16. 嵌入到主调函数中的函数称为内置函数,又称内嵌函数。 作用是提高程序的执行效率,大多编程语言都有自己的内置函数,如 Python 内置函数等。 内置函数的存在极大的提升了程序员的效率和程序的阅读。 Python 常见内置函数如下图 3.8 图 3.8 17. 数据结构-字典字典的内置函数(

24、表 3.1) 假设有一个字典型变量 dic=书名:满分计划,作者:陶小波 方法名 示例 说明 clear dic.clear 清空字典变量 get dic.get(“书名”) 根据 key 得到值 update dic.update(“页数”:”100”) 往字典内添加一项 表 3.1 18. 数据结构-列表列表的内置函数(表 3.2) 假设有一个列表型变量 ls=满分计划,1234567:true 方法名 示例 说明 append ls.append(“陶小波”) 向列表中追加一项 count ls.count(“满分计划”) 统计列表中某项的数量 index ls.index(满分计划)

25、指定内容在列表中的位置 pop ls.pop(1) 删除指定项 表 3.2 19. 数据类型-字符串字符串的内置函数(图 3.9) 图 3.9 20. 字符串和列表取值范围: 假设有字符串 s=”满分计划是由陶小波编写的” 。 代码 结果 说明 s0 “满” 取字符串/列表的第一个 s0:2 “满分” 从字符串第 0 个取到第 1 个(注意:0,2,左边是闭区间, 右边是开区间) s0: “满分计划是由陶小波编写的” 取字符串/列表的所有值 s0: “满分计划是由陶小波编写的” 取字符串/列表的所有值 s:1 “满分计划是由陶小波编写的” 取字符串/列表的所有值 s:-1 “写编波小陶由划计分

26、满” 取反字符串 s:2 “满计由小编” 间隔两位取值 表 3.3 21. 部分特殊代码列表 代码 等价代码 说明 a=b=0 a=0 b=0 定义变量 a,b=0,1 a=0 b=1 定义变量 a,b=b,a a=a+b b=a-b a=a-b a,b 两变量值交换 ls=input().split(,) k=int(i) for i in ls / 将字符串型的列表转换为数值型,并赋值给 k Print(%.2f % 123.45678) / 浮点数四舍五入输出,2f 表示保留两位小数 Print(%.2d % 1) / 按格式输出,2d 表示两位,位数不足,值前面补 0 22.Pytho

27、n 自定义函数 1)函数代码块以 defdef 关键词开头,后接函数标识符名称和圆括号()()。 2)任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。 3)函数的第一行语句可以选择性地使用文档字符串用于存放函数说明。 4)函数内容以冒号起始,并且缩进。 5) return 5) return 表达式表达式 结束函数,选择性地返回一个值给调用方。不带表达式的return 相当于返回 None 样例如下表所示 def 方法名(参数列表): return 结果 自定义函数格式自定义函数格式 def pra(x): If x %=0: return True else: retur

28、n False 自定义函数样例自定义函数样例 22. Python 第三方库导入方法。 导入方法 1 Import 库名 导入整个库 导入方法 2 Import 库名 as 别名 导入整个库,并定义别名 导入方法 3 From 库名 import * 导入库中的某些方法 23. 常见 Python 第三方库 库名 用户 Random 随机数 Math 数学包 JieBa 分词工具 Pandas 数据分析 Numpy 数组与矩阵运算 Matplotlib 绘图工具 24. random 包和 math 包常用方法表 Math 包方法 Random 包 第第 4 4 章章 数据处理与应用数据处理与

29、应用 1. 数据处理的核心是数据,数据的质量直接影响数据分析的结果。 2. 在数据分析和数据 挖掘前, 通常先对数据进行整理。 3. 数据整理的目的是检测和修正错漏的数据、 整合数据资源、 规整数据格式、 提高数据质量。 4. 数据计算是数据处理的常用方法之一 5. 日常简单的数据处理可以使用 Excel 软件完成, 专业的数据处理和统计分析工具有 SPSS、SAS、MATLAB 等,也可以通过 R、Python、 Java 等计算机语言编程进行数据处理。 6. 在 Excel 软件中,可以应用公式进行数据的计算。公式是以“=”开头,由常数、函数、 单元格引用和运算符组成的式子。 7. 单元格

30、引用是指对工作表中的单元格或单元格区域的引用。默认情况下,单元格引用 是相对的,如 Al;单元格绝对引用,如$A$1;连续的单元格区域引用,如 A2:D5;不连续的单元格区域引用,如 A2:A5,D2:D5。 8. 算术运算符有、十、,用于进行基本的数学运算。比较运算符有、 、,用于比较两个值,结果为逻辑值 TRUE 或 FALSE。文本连接运算符&, 可以连接一个或多个文本字符串,生成一段文本。 9. Excel 内置函数 函数名 使用 说明 SUM SUM(A1:A10) 求和 AVERAGE AVERAGE(A1:A10) 求平均值 MAX MAX(A1:A10) 求最大值 MI

31、N MIN(A1:A10) 求最小值 COUNT COUNT(A1:A10) 求数量 RANK RANK(A1:A10,A1) 求排名 表 1.1 10. 相对引用与绝对引用:Excel 中对单元格的引用可以是相对的,也可以是绝对的,相对的例如 A1:A10,绝对引用一般用$符号标识,例如$A1 就是锁定列,在填充的时候 A 不会随着,单元格位置的变换的变换而变换,同理 A$1 就是锁定行,$A$1 就是锁定行列。 11. 图表是用视觉形式向人们展示数据的一种方法。 常见的图表类型有柱形图、 折线图、 饼图、 雷达图、 散点图、 气泡图 12. 大数据具有数据量大、数据来源与类型多样、处理速度

32、快等特点 13. 处理大数据时,一般采用分治思想 14. 处理大数据的基本方法有批处理计算、流计算、图计算三种 15. 分布式计算 (Distributed Computing) 是把一个需要非常巨大的计算能力才能解决的问题 分成许多小部分, 然后把这些部分分配给许多计算机进行处理, 最后把这些计算结果综合起来得到最终的结果 16. 并行处理 (Parallel Processing) 是计算机系统中能同时执行两个或更多处理的一种计算方法 17. 大数据处理按照类型可划分为对静态数据的批处理、 对流数据的实时计算和对图结构数据的图计算 18. Windows 的文件系统采用 FAT32 或 N

33、TFS, Linux 的文件系统为 Ext2/Ext3/Ext4 19. HBase 是一个高可靠、高性能、 可伸缩、分布式的列式数据库 20. Map Reduce 是一种分布式并行编程模型, 能够处理大规模数据集的并行运算 21. 使用计算机语言编程,可以更加灵活、深入地进行数据分析和挖掘 22. numpy 模块是 Python 中做科学计算的基础库,主要提供科学计算中常用的随机数、数组运算等基础函数。 23. scipy 模块是基千 numpy 构建的一个模块,增强了在高等数学、信号处理、图像处理、统计等方面的处理能力。 24. pandas 模块基于 numpy 实现,主要用于数据的

34、处理和分析。它提供了大量处理数据的函数和方法,能方便地操作大型数据集。 25. pandas 提供了 Series 和 DataFrame 两种数据结构。使用这两种数据结构,可完成数据 的整理、计算、统计、分析及简单可视化。 26. 在 Python 中引入 pandas 模块的方法:import pandas as pd 27. Series 是一种一维的数据结构,包含一个数组的数据和一个与数据关联的索引 (index),索引值默认是从 0 起递增的整数。列表、字典等可以用来创建 Series 数据结构, 与列表不同的是,Series 的索引可以指定,类型可以为字符串型。 28. Serie

35、s 样例使用如下图 29.29. 通过索引可以选取通过索引可以选取 SeriesSeries 对象中的值,对象中的值, 通过赋值语句可以修改通过赋值语句可以修改 SerieSeries s 对象中的值。对象中的值。 如:如:s10=168 s10=168 、s2s01 =168, s2s01 =168, 可将可将 slsl、s2s2 对象中的“对象中的“ 166166改为“改为“ 168 168 ” 。” 。 30.30. DataFrameDataFrame 是一种二维的数据结构由是一种二维的数据结构由 1 1 个索引列个索引列(index)(index)和若干个数据列组成,每个数据和若干个

36、数据列组成,每个数据列可以是不同的类型。列可以是不同的类型。 DataFrameDataFrame 可以看作是共享同一个可以看作是共享同一个 index index 的的 Series Series 的集合。的集合。 创建创建DataFrameDataFrame 对象的方法很多,对象的方法很多, 通常用一个相等长度的列表或字典来创建。通常用一个相等长度的列表或字典来创建。如下图如下图 31. Pandas 也可以读取 Excel,代码如下图 32.32. DataFrameDataFrame 常见函数表常见函数表 33.33. matplotlibmatplotlib 是一个绘图库是一个绘图库

37、 ,使用其中的,使用其中的 pyplotpyplot 子库所提供的函数可以快速绘图和设置子库所提供的函数可以快速绘图和设置图图 表的坐标轴、表的坐标轴、 坐标轴刻度、图例等。常用绘图函数如坐标轴刻度、图例等。常用绘图函数如下下表表 34.34. 样例代码:绘制正弦函数图样例代码:绘制正弦函数图 左左 1 1 代码图,左代码图,左 2 2 结果图结果图 35. 文本数据处理是大数据处理的重要分支之一, 目的是从大规模的文本数据中提取出符合需要的、 感兴趣的和隐藏的信息。 目前, 文本数据处理主要应用在搜索引擎、 情报分析、 自动摘要、 自动校对、 论文查重、 文本分类、 垃圾邮件过滤、 机器翻译

38、、 自动应答等方面。 36. 文本处理的一般步骤: 文本内容是非结构化的数据, 要从大量的文本中提取出有用的信息, 需要将文本从无结构的原始状态转化为结构化的、 便于计算机处理的数据。 典型的文本处理过程主要包括:分词、 特征提取、 数据分析、 结果呈现 37. 中文分词是中文文本信息处理的基础, 机器翻译、 全文检索等涉及中文的相关应用中 都离不开中文分词。 分词是将连续的字序列按照一定的规范重新组合成词序列的过程 38. 分词的三种方法 基于词典的分词方法、基于统计的分词方法、基于规则的分词方法 39. 标签云用词频表现文本特征, 将关键词按照一定的顺序和规律排列 , 如频度递减、 字母顺

39、序等, 并以文字大小的形式代表词语的重要性 40. 文本情感分析是指通过计算机技术对文本的主观性、 观点、 情绪、 极性进行挖掘和分析, 对文本的情感倾向做出分类判断 41. 数据可视化的作用:快捷观察与追踪数据、实时分析数据、增强数据的解释力与吸引力 42. 数据可视化的基本方法: 有关时间趋势的可视化、 有关比例的可视化、 有关关系的可视化、有关差异的可视化、有关空间关系的可视化 43. 数据可视化的工具:用于数据可视化的工具有大数据糜镜、Gephi、Tableau 等,也可以使用Python、R 等 计算机语言编写程序实现数据的可视化 44. 分词与标签云的样例代码(下图 1、2) 图

40、1 图 2 45. 随着大数据在各行业的应用, 数据成为核心资产, 数据规模以及运用数据的能力成为各行业发展的推动力 46. 智慧交通包括:交通信息服务系统、交通管理系统、电子收费系统 47. 大数据在电子商务的使用:精准营销、供应链管理、智能网站 第第 5 5 章章 人工智能及应用人工智能及应用 1. 人工智能,是指以机器(计算机)为载体,模仿、延伸和扩展人类智能,其与人类或其他动物所呈现的生物智能有着重要区别。 2. 人工智能作为一门多学科广泛交叉的前沿科学,不仅涉及计算机科学,还涉及控制科学、认知科学、心理科学、脑及神经科学、生命科学、语言学、逻辑学、行为科学、教育科学、数理科学等众多学

41、科领域如下图 3. 人工智能的三种主要方法,即符号主义、联结主义和行为主义。 4. 符号主义(Symbolicism),又称逻辑主义、心理学派或计算机学派,认为学习或者其他的智能特征原则上均可以被符号精确地描述,从而被机器仿真 5. 联结主义(Connectionism),又称仿生学派或生理学派,通过模仿人类大脑中神经元之间的复杂交互来进行认知推理 6. 行为主义(Actionism),又称进化主义或控制论学派,这一方法从“交互反馈角度来刻画智能行为,认为智能体可以在与环境的交互中不断学习,从而提升自己的智能水平 7. 人工智能自 1955 年登上历史舞台后,在视觉计算、语音识别、机器翻译、问

42、答助理、商品推荐和无人系统等领域蓬勃发展。 8. 20 世纪 30 年代, 三种计算机制相继被提出, 它们分别是原始递归函数、 lambda演算和图灵机。 9. 计算机的诞生为通过机器来模拟人类智能提供了无限的想象空间, 促进了人工智能的发展。下图为图灵机模型 10. 依赖于领域知识和数据的人工智能被称为领域人工智能 11. 跨领域人工智能指智能系统从一个领域快速跨越到另外一个领域。跨领域人工智能不仅依赖于已有数据和已有规则,而且专注于知识和技能的获取,能够举一反三、触类旁通,开展深度推理。 12. 混合增强智能是多种智能体的混合形式,它将人的作用或人的认知模型引入人工智能系统,形成“混合增强

43、智能”的形态。 13. 近年来,人工智能技术正快速融入人们的生活,使人们居家、出行、购物、医疗等日常活动越来越便捷。常见的有智能家居、智慧城市、智慧出行、智能购物 14. 人工智能的发展可以为人类社会带来巨大的经济效益。 15. 通过人工智能技术提高生产力、创造全新的产品和服务,是经济竞争和升级的迫切需求。 16. 推动人工智能与实体经济结合,是加快实体经济转型升级的必然发展方向。人工智能对传统产业的转型升级有着强大的驱动作用。 17. 人工智能发展在就业、安全、伦理等方面可能带来新的挑战,人们一方面希望人工智能和智能机器能够代替人类从事各种劳动,另一方面又担心它们的发展会引起新的社会问题。

44、18. 人工智能理论和技术的快速发展和不断突破,尤其是在一些方面超越人类的表现,使人们开始担忧是否会对它失去控制或是一旦落入反人类的社会成员手中会被用于反人类和危害社会的犯罪。对此人们必须保持高度警惕,同时人类要有足够的智慧和信心,研制出防范和侦破各种智能犯罪活动的措施。正如美国著名科幻作家阿西莫夫(Asimov)提出的“机器人三守则”:心机器人必须不危害人类,也不允许它眼看人类受害而袖手旁观;机器人必须绝对服从人类,除非这种服从有害人类;机器人必须保护自身不受伤害,除非为了保护人类或者人类命令它做出牺牲。 19. 人工智能技术对经济发展、 社会进步都有巨大的推动作用。 随着技术的进步,这种影

45、响将越来越大、 越来越明显。 也许有些影响现在还难以预测, 但可以肯定,未来人类与智能机器必定可以安全、和谐地相处,人工智能必将对人类的物质文明和精神文明产生深远影响。 20. 度学习是一种对原始数据所蕴含的特征模式进行学习的算法模型。最常用的深度学习模拟人类大脑处理数据的机制,逐层抽象对原始数据进行学习。 21. 深度学习中,一般会构造包含若干层的神经网络,每一层中有若干神经元,前后相邻层中的神经元彼此联结。一旦给定海量数据,就可以学习神经元之间的链接权重。 22. 深度学习这一数据驱动方法在自然语言处理、知识图谱构建、图像分类、语音识别和视频运动提取等领域表现出良好的性能 23. 人工智能

46、典型方法中还存在另一种学习方式、即问题引导下的试错学习 24. 人工智能(尤其是深度学习方法)在车牌识别上取得了较大成功。此外,人工智能在车辆颜色与车辆厂商标志识别、无牌车检测、非机动车检测与分类、车头车尾判断、车辆检索、人脸识别等方面的应用也比较成熟。 25. 跨领域人工智能研究难度较大,虽然人类擅长举一反三式的跨域学习,但是对人工智能算法而言, 尚缺乏一条清晰推进跨领域人工智能的思路。 专家们认为,在跨领域人工智能的研究过程中,需要从特殊技能到泛化技能、从单一知识到多源知识、从易到难,永不停息地学习。 26. 通过人工智能技术提高生产力、创造全新的产品和服务,是经济竞争和升级的迫切需求。

47、27. 人工智能并不是单一的技术,它将融入现有的生产中,在垂直领域加深数字化的影响。 28. 推动人工智能与实体经济结合,是加快实体经济转型升级的必然发展方向 29. 人工智能对传统产业的转型升级有着强大的驱动作用 30. 拓展阅读 1(中文房间) : “中文房间“实验。美国哲学家约翰 希尔勒(JohnSearle)提出,假设他被锁在 一个房间里,房间里有很多中国书法作品。他并不懂中文,甚至无法将汉语与日语或其他 毫无意义的字区分开来。希尔勒在房间中发现了一套规则(即人工智能算法) ,这些规则可将中文翻译为英文。随后,每当屋外的人用中文向希尔勒提问,希尔勒通过这些规则将 中文问题翻译为英文,又

48、用这些规则将自己回答的英文答案翻译为中文,进而将翻译得到的中文反馈给屋外的提问者(如图 5.3.4 所示) 。过了一会儿,希尔勒逐渐熟悉了这项任务一尽管他仍然不清楚自己操作的这些符号到底是什么。 希尔勒问,这种情况下能否说房间内的人懂中文?答案是否定的。 31. 拓展阅读 2(智慧城市) : 英国建筑师罗恩 赫伦(RonHerron)提出了行走的城市”的概念。如同在前卫的建筑期刊阿基格拉姆学派中所描述的,赫伦支持建造巨大的人工智能移动机器人平台,这种平台就像是背着摩天大楼在地球漫步的蜘蛛。这些四处行走的城市可以在地球上无国界地生存,可以随意前往它们需要获取资源或制造能械的任何地方。赫伦的城市甚至还有相互连接以创造更大的“行走的城市”的能力。这种城市不仅可以自给自足,而且由于人工智能的突破性发展,还能够自治

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中信息 > 教科版(2019) > 必修1 数据与计算