Microsoft PowerPoint - seminar-10-ch19-iterator.ppt

Similar documents

《C语言基础入门》课程教学大纲

第2章数据类型、常量与变量

何秋琳张立春视觉学习研究进展视觉注意视觉感知

说明为了反映教运行的基本状态, 为校和院制定相关政策和进行教建设与改革提供据依据, 校从程资源 ( 开类别开量规模 ) 教师结构程考核等维度, 对 2015 年春季期教运行基

类似地, 又可定义变下限的定积分 : ( ). 与 ψ 统称为变限积分. f ( ) d f ( t) dt,, 注在变限积分 (1) 与 () 中, 不可再把积分变量写成的形式 ( 例如 ) 以免与积分上下限的

修改版-操作手册.doc

生产支援功能　使用说明书（IP-110 篇）

,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

2006年顺德区高中阶段学校招生录取分数线

登录、注册功能的测试用例设计.doc

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

正规培训达规定标准学时数, 并取得结业证书二级可编程师 ( 具备以下条件之一者 ) (1) 连续从事本职业工作 13 年以上 (2) 取得本职业三级职业资格证书后, 连续从事本职业

龚亚夫在重新思考基础教育英语教学的理念一文中援引的观点认为当跳出本族语主义的思维定式后需要重新思考许多相连带的问题比如许多发音的细微区别并不影响理解和

Template BR_Rec_2005.dot

Microsoft Word - 第7章图表反转形态.doc

采取行动的机会 90% 开拓成功的道路 2

<4D F736F F D20BFC9B1E0B3CCD0F2BFD8D6C6CFB5CDB3C9E8BCC6CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

3 复试如何准备 4 复试成绩计算 5 复试比例 6 复试类型 7 怎么样面对各种复试 04 05

Microsoft Word - 文件汇编.doc

金不少于 800 万元, 净资产不少于 960 万元 ; (3) 近五年独立承担过单项合同额不少于 1000 万元的智能化工程 ( 设计或施工或设计施工一体 ) 不少于 2 项 ; (4) 近三年每年

0 年上半年评价与考核细则序号部门要素值考核内容考核方式考核标准考核 ( 扣原因 ) 考评得 3 安全生产目 30 无同等责任以上道路交通亡人事故无轻伤责任事故无重大质量

Microsoft Word - 第3章.doc

<4D F736F F D C3E6CFF2B6D4CFF3A3A8B5DAC8FDD5C220C0E0CCD8D0D4A3A92E646F63>

附件 : 上海市建筑施工企业施工现场项目管理机构关键岗位人员配备指南二一四年九月十一日 2

ETF、分级基金规模、份额变化统计

( ) 信号与系统 Ⅰ 学科基础必修课教周 2016 年 06 月 13 日 (08:00-09:35) ( )

用节点法和网孔法进行电路分析

抗日战争研究年第期

全国建筑市场注册执业人员不良行为记录认定标准（试行）.doc

Microsoft Word - GT21L16S2W简要说明V3.7.doc

导数和微分的概念导数的几何意义和物理意义函数的可导性与连续性之间的关系平面曲线的切线和法线导数和微分的四则运算基本初等函数的导数复合函数反函数隐函数以

18 上报该学期新生数据至阳光平台第一学期第四周至第六周 19 督促学习中心提交新增专业申请第一学期第四周至第八周 20 编制全国网络统考十二月批次考前模拟题第一学

HSK( 一级 ) 考查考生的日常汉语应用能力, 它对应于国际汉语能力标准一级欧洲语言共同参考框架 (CEF) A1 级通过 HSK( 一级 ) 的考生可以理解并使用一些非常简单的汉语

深圳市新亚电子制程股份有限公司

定位和描述 : 程序设计 / 办公软件高级应用级考核内容包括计算机语言与基础程序设计能力, 要求参试者掌握一门计算机语言, 可选类别有高级语言程序设计类数据库编程类

第六章债券股票价值评估 1 考点一 : 债券价值的影响因素 2

一开放性的政策与法规二两岸共同的文化传承三两岸高校各自具有专业优势远见杂志年月日

际联考的非美术类本科, 提前批本科体育类第一批第二批第三批的理工类和文史类本科平行志愿, 考生可以填报 6 所院校志愿符合贫困地区专项计划和农村考生专项计划报考

第二讲数列

目录关于图标... 3 登陆主界面... 3 工单管理... 5 工单列表... 5 搜索工单... 5 工单详情... 6 创建工单... 9 设备管理巡检计划查询详情销售管

马克思主义公正观的基本向度及方法论原则!! # #

中国软科学年第期!!!

<4D F736F F D C4EAB9A4B3CCCBB6CABFCAFDD1A7D7A8D2B5BFCEBFBCCAD4B4F3B8D9D3EBD2AAC7F3>

评委 : 李炎斌 - 个人技术标资信标初步审查明细表序号投标单位投标函未按招标文件规定填写漏填或内容填写错误的 ; 不同投标人的投标文件由同一台电脑或同一家投标单

一从分封制到郡县制一从打虎亭汉墓说起

抗战时期国民政府的银行监理体制探析 % # % % % ) % % # # + #, ) +, % % % % % % % %

名称生命科学学院环境科学 1 生物学仅接收院内调剂, 初试分数满足我院生物学复试最低分数线生命科学学院生态学 5 生态学或生物学生命科学学院

¹ º ¹ º 农业流动人口是指户口性质为农业户口在流入地城市工作生活居住一个月及以上的流动人口非农流动人口是指户口性质为非农户口在流入地城市工作生活居住一个

收入支出项目 2016 年预算项目 2016 年预算预算 01 表单位 : 万元 ( 保留两位小数 ) 一公共财政预算拨款一人员经费一般财力人员支出成品

抗日战争研究 % 年第期! # # % %

Cybozu Garoon 3 管理员手册

教师上报成绩流程图

数学标准不练习 1.1 理解问题并坚持解决这些问题 1.2 以抽象和定量方式推理 1.3 建构可行参数和评判他人的推理 1.4 使用数学方法建模 1.5 策略性地使用合适的工具 1.6

证券代码：证券简称：长城电脑公告编号：

<4D F736F F D D323630D6D0B9FAD3A6B6D4C6F8BAF2B1E4BBAFB5C4D5FEB2DFD3EBD0D0B6AF C4EAB6C8B1A8B8E6>

世华财讯模拟操作手册

自服务按钮无法访问新系统的自服务页面因此建议用户从信网中心 ( 主页, 右下角位置的常用下载, 或校园网用户自服务 ( 首页

& & ( & ) +,! #

( 二 ) 现行统一高考制度不利于培养人的创新精神,,,,,,,,,,,,, [ ],,,,,,,,,,, :, ;,,,,,,? ( 三 ) 现行统一高考制度不利于全体学生都获得全面发展,, [ ],,,,,,,,,,,

云信Linux SSH认证代理用户手册

精勤求学自强不息 Born to win! 解析 : 由极限的保号性知存在 U ( a) 当 a 时 f ( ) f ( a) 故 f ( ) 在点 a 不取极值 f ( ) f ( a) f ( ) f ( a) lim lim a a a a ( a)

<4D F736F F D20B9D8D3DAB0BABBAAA3A8C9CFBAA3A3A9D7D4B6AFBBAFB9A4B3CCB9C9B7DDD3D0CFDEB9ABCBBE C4EAC4EAB6C8B9C9B6ABB4F3BBE1B7A8C2C9D2E2BCFBCAE92E646F6378>

(Microsoft Word - NCRE\314\345\317\265\265\367\325\37313\324\27221\272\3051.doc)

Microsoft Word - 资料分析练习题09.doc

黄金原油总持仓增长, 同比增幅分别为 4.2% 和 4.1% 而铜白银以及玉米则出现减持, 减持同比减少分别为 9.4%,9.4% 以及 6.5% 大豆, 豆粕结束连续 4 周总持仓量增长, 出现小幅

徐天宏：《基因天堂》.doc

<4D F736F F D20CAAEC8FDCEE5B9E6BBAED7EED6D5B8E5352E33312E646F63>

评委 : 徐岩宇 - 个人技术标资信标初步审查明细表序号投标单位投标函未按招标文件规定填写漏填或内容填写错误的 ; 不同投标人的投标文件由同一台电脑或同一家投标单

一六年级下册教科书总体说明 ( 一 ) 教学内容本册教科书一共安排了 5 个教学单元, 其中前 4 个单元为新知识, 第五单元是对整个小学阶段所学数学知识系统的整理和复习

Transcription:

NumPy 中的多维迭代器代码之美第 19 章江涌

NumPy 是 Python 的一个可选安装包, 提供了一个功能强大的 N 维数组对象 NumPy 提供了多种数组的数学化操作与结构化操作, 使得 Python 能够很好地开发一些关键的并且要求运行速度很快的工程代码和科学代码 NumPy 中通过切片 (slicing) 的概念来实现快速结构化操作记法为 [start:stop:stride], 例如 im2=im[8:2:-1,9:1:-3] 按照 slicing 方式选取的新影像将与原始影像共享数据, 不会生成一个副本, 减少计算机资源的消耗

关键挑战经常需要遍历数组中的元素, 在遍历中进行所需要的操作简单想法 : 用单层 for 循环处理一维, 双层 for 循环处理两维但当维数 N 是一个任意整数, 怎么办? 递归 : 递归条件 (recursive case), 基线条件 (base case) Copy_ND(a,b,N) // 将 N 维数组 b 复制到 N 维数组 a 递归实现 :if (N==0) copy memory from b to a return for i=0 to size of first dimension of a and b ptr_b=b[i] Copy_ND(ptr_a,ptr_b,N-1) a[i]=ptr_a

递归算法在每次迭代中进行函数调用, 容易产生速度很慢的代码 ; 许多算法需要保存中间值用于后续的递归调用 ( 求最大值 ), 这些值将被作为递归调用的参数传递, 很难提供用于递归解决方案的简化工具因此,NumPy 使用迭代来完成迭代器 (Iterator) 是一种简化这些算法的抽象, 包含了单个循环内遍历数组中所有元素的思想迭代器的两个基本方法 : hasnext 是否还有下一个元素 ; next 返回下一个元素 for x in iterobj: process(x)

数组的内存模型邻接型数组 : 在内存中连续存放一个二维 4*5 数组 >>>p=[[1,2,3,4,5], [6,7,8,9,10], [11,12,13,14,15], [16,17,18,19,20]] >>>from numpy import * >>>pp=array(p) >>>p1=pp[1:3,1:4] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

跨度数组中某一维的跨度 (stride): 沿着这一维, 或者说数轴, 从数组中的一个元素移动到下一个元素, 需要跳过多少字节 ( 跨度可以是负数 ) pp: 第一维跨度 4*5, 第二维跨度 4; p1: 第一维跨度 4*5, 第二维跨度 4.

迭代器设计迭代器循环伪码 : set up iterator (including pointing the current value to the first value in the array) while iterator not done: process the current value point the current value to the next value 设计分为三部分 : 1. Moving to the next value 2. Termination 3. Setup

递进确定按怎样的顺序来提取元素 NumPy 中通过使用一组数字来模拟简单计数而实现用 N 元整数组来表示当前位置, 数组的形状 n1 n2... nn (0,,0) 表示数组第一个元素,( n1 1, n2 1,..., n N 1) 表示数组的最后一个元素下一个元素的位置是将最后一个数字加 1 来得到若第 i 个数字到达了 n i, 那么这个数字将被设置为 0, 而第 (i-1) 个数字将增 1 比如对于数组来说 3 2 3 (0,0,0)(0,0,1)(0,0,2)(0,1,0)(0,1,1)(0,1,2)(1,0,0)...(2,1,1)(2,1,2)

假设 data 是指向数组起始位置的指针,counter[N] 是计数器数组,strides[N] 是跨度值数组, 那么下面的运算将把 dataptr 设置为指向数组当前值的第一个字节 : dataptr = (char *)data; for (i=0; i<n; i++) dataptr += counter[i]*strides[i]; 事实上可以在记录计数器的同时也记录指针, 当计数器的第 i 个下标增 1 时,dataptr 将会增加 strides[] i ; 当第 i 个下标复位为 0 时, 数组当前值的内存地址应该减去 ( n 1) strides[ i] i 迭代器负责维护计数器与指向当前值的指针

终止判断迭代器何时完成及如何发出终止信号 1. 附加标志变量到迭代器上, 每次迭代中都进行判断, 如果没有元素了就设置这个标志 2. 查找在第一维的计数器中从 ni 1 到 0 的跃迁点 3. 如果给定了数组的大小, 只需记住将要进行的迭代次数 NumPy 中将迭代的总次数作为信息保存下来, 以及保存一个到目前为止的迭代次数的动态计数器, 当达到迭代的总次数时迭代终止

构建需要保存的信息 : 整数计数器 ( 初始设置为 0) 下标计数器 ( 初始设置为 (0,0,,0)) 判断是否基于简单的邻接内存, 设置标志保存判断结果为了加速回卷步骤, 保存每一维 ( ni 1), 避免重复计算 ( ni 1) strides[ i] 跨度信息, 维数信息, 元素数量保存系数 li ( i = 1,... N) 来简化整数计数器与下标计数器的转化当前指针

数组中的每一项都可以用一个在 0 和 n1... n N 之间 1 的整数 k 或者下标计数器 ( k1,..., k N ) 来表示, 这个关系可以被定义为 N N ( ) k k n = i i= 1 j=+ i 1 j 或 l1 = k N l mod( ) i = l i 1 nj k i j= i i = N n j j = i + 1 l

coords[n] dims_m1[n] strides[n] backstrides[n] nd_m1 dataptr size index factors 下标计数器 N 维数组 N 维数组保存每一维 ni 1 N 维数组, 保存每维跨度 N 维数组, 回卷时需要移动的数量 strides[i] 维数 ( ni 1) 指向当前位置内存的指针所有元素数量 n n n 1 2... N 整数计数器从 0 变到 size-1 计算一维下标和 N 维下标转换时辅助数组

记录迭代计数器注意计数器的递进都是从最后一维增 1 开始, 当某维大于 n 1 时发生回卷, 此时可能使其他维的下标也发生回卷 i 于是可以从最后维开始向前循环在当前维上判断当前下标是不是小于 n 1, 如果是, 则将下标位置加 1, 并且将当前维对应的 strides[i] 加到 dataptr 上, 跳出循环 ; 若第 i 维下标的计数器大于或等于 i n 1 i, 就重新设为 0, 且将 dataptr 减去该维对应的 backstrides[i]( 回卷 ), 继续循环判断前一维

C 语言实现 for (i=it->nd_m1; i>=0; i--) { if (it->coords[i] < it->dims_m1[i]) { it->coords[i]++; it->dataptr += it->strides[i]; break; } else { it->coords[i] = 0; it->dataptr -= it->backstrides[i]; } }

使用 while 语句 done = 0; i = it->nd_ml; while (!done i>=0) { /*&&*/ if (it->coords[i] < it->dims_m1[i]) { it->coords[i]++; it->dataptr += it->strides[i]; done = 1; } else { it->coords[i] = 0; it->dataptr -= it->backstrides[i];} i--; }

NumPy 迭代器的结构 typedef struct { PyObject_HEAD int nd_m1; npy_intp index, size; npy_intp coords[npy_maxdims]; npy_intp dims_m1[npy_maxdims]; npy_intp strides[npy_maxdims]; npy_intp backstrides[npy_maxdims]; npy_intp factors[npy_maxdims]; PyArrayObject *ao; char *dataptr; npy_bool contiguous; } PyArrayIterObject; 指向构建迭代器的原始数组的指针判断是否邻接数组

接口在 NumPy 中 it=pyarray_iternew(ao) ------------- 构建数组 ao 的迭代器 PyArray_ITER_NOTDONE(it) ------------- 判断迭代是否结束 PyArray_ITER_NEXT(it) ------------- 实现迭代的下一个位置 PyArray_ITER_DATA(it) ------------- 得到指向当前值第一个字节的指针

示例 : 计算 N 维数组中的最大值 ( 假设数组 ao 是 double 类型 ) #include <float.h> double *currval, maxval=-dbl_max; PyArrayIterObject *it; it = PyArray_IterNew(ao); while (PyArray_ITER_NOTDONE(it)) { currval = (double *)PyArray_ITER_DATA(it); if (*currval > maxval) maxval = *currval; PyArray_ITER_NEXT(it); }

用迭代器处理邻接数组也是很快的, 但是更快的还是传统办法 : double *currval, maxval=-max_double; int size; currval = (double *)PyArray_DATA(ao); size = PyArray_SIZE(ao); while (size--) { if (*currval > maxval) maxval = *currval; currval += 1; }

迭代器的使用排除某一维的迭代当操作不涉及到某维时可以使迭代器跨过这维进行迭代, 以获得速度提升例如数组 a[3][3], 只想修改 a(0,0),a(1,0),a(2,0) 的值 1 2 3 1 2 3

通常是排除最后一维,NumPy 的前身 Numeric 就是引入这种方法实现数学功能 NumPy 中对迭代器稍微改动 it=pyarray_iterallbutaxia(array,&dim) dim 为排除的维当输入的维是 -1 时, 将会自行选择最小非零跨度值的维另一种经常的选择就是排除有最大元素数量的维, 这样将迭代次数降至最低

实现 : 1. 将迭代大小除以将要移除的维的长度 ; 2. 将被选择的维的元素数量设置为 1:dims_m1[i]=0; 3. 将该维在 backstrides 中相应位置上的值设置为 0; 4. 将邻接标志重新设置为 0, 因为现在要处理的数组在内存中将不会是邻接的在循环的每次迭代中, 迭代器将指向数组所选择维的第一个元素

迭代器的使用多重迭代数组加法需要多个迭代器, 每个输入数组一个迭代器, 并且输出数组一个迭代器 NumPy 提供了一个多重迭代器, 可以对多个迭代器同时处理这种多迭代器经常用于自动处理 NumPy 的广播 (broadcasting) 功能广播能使一个 (4,1) 形状的数组加到一个 (3) 形状的数组上, 得到形状 (4,3) 的数组, 也能对一个 (5,1,1) 形状数组, 一个 (4,1) 形状数组和一个 (3) 形状数组进行运算, 得到一个 (5,4,3) 形状的数组

>>>p=array([[1,2,3], >>>a=array([[1],[2],[3],[4]]) [4,5,6], >>>a1=[2,1,4] [7,8,9]]) >>>print a+a1 >>>p1=[2,1,4] [[3,2,5], >>>print p+p1 [4,3,6], [[3,3,7], [5,4,7], [6,6,10], [6,5,8]] [9,9,13]]

The rules of broadcasting are: Arrays with fewer dimensions are treated as occupying the last dimensions of an array that has the full number of dimensions, so that all arrays have the same number of dimensions. The new, initial dimensions are filled in with 1s. The length of each dimension in the final broadcast shape is the greatest length of that dimension in any of the arrays.

For each dimension, all inputs must either have the same number of elements as the broadcast result or a 1 as the number of elements. Arrays with a single element in a particular dimension act as if that element were virtually copied to all positions during the iteration. In effect, the element is broadcast to the additional positions.

修改迭代器实现广播功能 : 修改迭代器的形状为匹配广播的形状, 用于广播维数的 strides 和 backstrides 被修改为 0, 这样这一维递进时, 迭代器不会移动数据指针, 无需复制内存

PyObject *multi; PyObject *in1, *in2; double *i1p, *i2p, *op; /* get in1 and in2 (assumed to be arrays of NPY_DOUBLE) */ /* first argument is the number of input arrays; the next (variable number of) arguments are the array objects */ multi = PyArray_MultiNew(2, in1, in2); /* construct output array */ out = PyArray_SimpleNew(PyArray_MultiIter_NDIM(multi), 输出数组 PyArray_MultiIter_DIMS(multi), NPY_DOUBLE); 数组当前数据指向 op = PyArray_DATA(out); 多重迭代器

while(pyarray_multiiter_notdone(multi)) { /* get (pointers to) the current value in each array */ i1p = PyArray_MultiIter_DATA(multi, 0); i2p = PyArray_MultiIter_DATA(multi, 1); /* perform the operation for this element */ *op = *ip1 + *ip2 op += 1; /* Advance output array pointer */ /* Advance all the input iterators */ PyArray_MultiIter_NEXT(multi); }

总结迭代器是一个非常漂亮的抽象 NumPy 的迭代器为 Python 的数组运算提供了很强大的灵活工具, 并且无需考虑数组在内存中是否邻接, 以切片的概念减少内存的消耗它的优化循环与广播机制都是其漂亮的发光点