RunLoop
是iOS开发中非常基础的一个概念,这篇文章将从CFRunLoop
的源码入手,介绍RunLoop
的概念以及底层实现原理。之后会介绍一下在iOS中,苹果是如何利用RunLoop
实现自动释放池、延迟回调、触摸事件、屏幕刷新等功能的。
RunLoop的概念
一般来讲,一个线程一次只能执行一个任务,执行完成后线程就会退出。如果我们需要一个机制,让线程能随时处理事件但并不退出,通常的代码逻辑是这样的:
1 | function loop() { |
这种模型通常被称作Event Loop
。 OSX/iOS里的RunLoop
实现了Event Loop
。实现这种模型的关键点在于:如何管理事件/消息,如何让线程在没有处理消息时休眠以避免资源占用、在有消息到来时立刻被唤醒。
所以,RunLoop
实际上就是一个对象,这个对象管理了其需要处理的事件和消息,并提供了一个入口函数来执行上面Event Loop
的逻辑。线程执行了这个函数后,就会一直处于这个函数内部”接受消息->等待->处理”的循环中,直到这个循环结束(比如传入quit的消息),函数返回。
OSX/iOS系统中,提供了两个这样的对象:NSRunLoop
和 CFRunLoopRef
。CFRunLoopRef
是在CoreFoundation
框架内的,它提供了纯C函数的API,所有这些API都是线程安全的。NSRunLoop
是基于CFRunLoopRef
的封装,提供了面向对象的API,但是这些API不是线程安全的。
CFRunLoopRef
的代码是开源的,你可以在这里下载到整个 CoreFoundation
的源码来查看。
RunLoop与线程的关系
首先,iOS开发中能遇到两个线程对象: pthread_t
和NSThread
。 二者之间是一一对应的。比如,你可以通过pthread_main_thread_np()
或[NSThread mainThread]
来获取主线程,也可以通过pthread_self()
或[NSThread currentThread]
来获取当前线程。CFRunLoop
是基于pthread
来管理的。
苹果不允许直接创建RunLoop
,它只提供了两个自动获取的函数:CFRunLoopGetMain()
和CFRunLoopGetCurrent()
。这两个函数内部的逻辑大概是下面这样:
1 | // 全局的Dictionary,key是pthread_t,value是CFRunLoopRef |
从上面的代码可以看出,线程和RunLoop
之间是一一对应的,其关系是保存在一个全局的Dictionary
里。线程刚创建时并没有RunLoop
,如果你不主动获取,那它一直都不会有。RunLoop
的创建是发生在第一次获取时,RunLoop
的销毁是发生在线程结束时。你只能在一个线程的内部获取其RunLoop
(主线程除外)。
RunLoop对外的接口
在CoreFoundation
里面关于RunLoop
有5个类:
CFRunLoopRef
CFRunLoopModeRef
CFRunLoopSourceRef
CFRunLoopTimerRef
CFRunLoopObserverRef
其中CFRunLoopModeRef
类没有对外暴露,只是通过CFRunLoopRef
的接口进行了封装。他们的关系如下:
一个RunLoop
包含若干个Mode,每个 Mode 又包含若干个 Source/Timer/Observer。每次调用RunLoop
的主函数时,只能指定其中一个 Mode,这个Mode被称作CurrentMode。如果需要切换Mode,只能退出 Loop,再重新指定一个Mode进入。这样做主要是为了分隔开不同组的 Source/Timer/Observer,让其互不影响。
CFRunLoopSourceRef
CFRunLoopSourceRef
是事件产生的地方。Source有两个版本:Source0和Source1。
- Source0只包含了一个回调(函数指针),它并不能主动触发事件。使用时,你需要先调用
CFRunLoopSourceSignal(source)
,将这个 Source标记为待处理,然后手动调用CFRunLoopWakeUp(runloop)
来唤醒RunLoop,让其处理这个事件。 - Source1包含了一个mach_port和一个回调(函数指针),被用于通过内核和其他线程相互发送消息。这种Source能主动唤醒RunLoop的线程,其原理在下面会讲到。
CFRunLoopTimerRef
CFRunLoopTimerRef
是基于时间的触发器,它和NSTimer
是toll-free bridged的,可以混用。其包含一个时间长度和一个回调(函数指针)。当其加入到RunLoop时,RunLoop会注册对应的时间点,当时间点到时,RunLoop会被唤醒以执行那个回调。
CFRunLoopObserverRef
CFRunLoopObserverRef
是观察者,每个Observer都包含了一个回调(函数指针),当RunLoop的状态发生变化时,观察者就能通过回调接受到这个变化。可以观测的时间点有以下几个:
1 | typedef CF_OPTIONS(CFOptionFlags, CFRunLoopActivity) { |
上面的Source/Timer/Observer被统称为mode item
,一个item可以被同时加入多个mode。但一个item被重复加入同一个mode时是不会有效果的。如果一个mode中一个item都没有,则RunLoop会直接退出,不进入循环。
RunLoop的Mode
CFRunLoopMode
和CFRunLoop
的结构大致如下:
1 | typedef struct __CFRunLoopMode *CFRunLoopModeRef; |
这里有个概念叫”CommonModes”:一个Mode可以将自己标记为”Common”属性(通过将其 ModeName添加到RunLoop的 “commonModes”中)。每当RunLoop的内容发生变化时,RunLoop都会自动将_commonModeItems里的Source/Observer/Timer同步到具有 “Common”标记的所有Mode里。
应用场景举例:主线程的RunLoop里有两个预置的 Mode:kCFRunLoopDefaultMode
和UITrackingRunLoopMode
。这两个 Mode都已经被标记为”Common”属性。DefaultMode是 App 平时所处的状态,TrackingRunLoopMode是追踪ScrollView滑动时的状态。当你创建一个Timer并加到DefaultMode时,Timer会得到重复回调,但此时滑动一个TableView时,RunLoop会将mode切换为 TrackingRunLoopMode,这时Timer就不会被回调,并且也不会影响到滑动操作。
有时你需要一个Timer,在两个Mode中都能得到回调,一种办法就是将这个 Timer分别加入这两个Mode。还有一种方式,就是将Timer加入到顶层的 RunLoop 的”commonModeItems”中。”commonModeItems”被 RunLoop自动更新到所有具有”Common”属性的Mode里去。
CFRunLoop对外暴露的管理Mode接口只有下面2个:
1 | CFRunLoopAddCommonMode(CFRunLoopRef runloop, CFStringRef modeName); |
Mode暴露的管理mode item
的接口有下面几个:
1 | CFRunLoopAddSource(CFRunLoopRef rl, CFRunLoopSourceRef source, CFStringRef modeName); |
你只能通过mode name来操作内部的mode,当你传入一个新的mode name 但RunLoop内部没有对应mode时,RunLoop会自动帮你创建对应的 CFRunLoopModeRef
。对于一个RunLoop来说,其内部的mode只能增加不能删除。
苹果公开提供的Mode有两个:kCFRunLoopDefaultMode
(NSDefaultRunLoopMode) 和UITrackingRunLoopMode
,你可以用这两个Mode Name来操作其对应的 Mode。
同时苹果还提供了一个操作Common标记的字符串:kCFRunLoopCommonModes (NSRunLoopCommonModes),你可以用这个字符串来操作Common Items,或标记一个Mode为”Common”。使用时注意区分这个字符串和其他mode name。
RunLoop的内部逻辑
根据苹果在文档里的说明,RunLoop内部的逻辑大致如下:
其内部代码整理如下(太长了不想看可以直接跳过去,后面会有说明):
1 | // 默认用kCFRunLoopDefaultMode启动RunLoop |
可以看到,实际上RunLoop就是这样一个函数,其内部是一个do-while 循环。当你调用CFRunLoopRun()
时,线程就会一直停留在这个循环里,直到超时或被手动停止,该函数才会返回。
RunLoop的底层实现
从上面代码可以看到,RunLoop的核心是基于mach port
的,其进入休眠时调用的函数是mach_msg()
。为了解释这个逻辑,下面稍微介绍一下 OSX/iOS的系统架构。
苹果官方将整个系统大致划分为上述4个层次:
应用层包括用户能接触到的图形应用,例如 Spotlight、Aqua、SpringBoard 等。
应用框架层即开发人员接触到的 Cocoa 等框架。
核心框架层包括各种核心框架、OpenGL等内容。
Darwin 即操作系统的核心,包括系统内核、驱动、Shell 等内容,这一层是开源的,其所有源码都可以在 opensource.apple.com 里找到。
我们在深入看一下Darwin这个核心的架构:
其中,在硬件层上面的三个组成部分:Mach、BSD、IOKit (还包括一些上面没标注的内容),共同组成了 XNU 内核。
XNU 内核的内环被称作 Mach,其作为一个微内核,仅提供了诸如处理器调度、IPC (进程间通信)等非常少量的基础服务。
BSD 层可以看作围绕 Mach 层的一个外环,其提供了诸如进程管理、文件系统和网络等功能。
IOKit 层是为设备驱动提供了一个面向对象(C++)的一个框架。
Mach 本身提供的 API 非常有限,而且苹果也不鼓励使用 Mach 的 API,但是这些API非常基础,如果没有这些API的话,其他任何工作都无法实施。在 Mach 中,所有的东西都是通过自己的对象实现的,进程、线程和虚拟内存都被称为”对象”。和其他架构不同, Mach 的对象间不能直接调用,只能通过消息传递的方式实现对象间的通信。”消息”是 Mach 中最基础的概念,消息在两个端口 (port) 之间传递,这就是 Mach 的 IPC (进程间通信) 的核心。
Mach 的消息定义是在 <mach/message.h> 头文件的,很简单:
1 | typedef struct { |
一条Mach消息实际上就是一个二进制数据包 (BLOB),其头部定义了当前端口local_port和目标端口remote_port,
发送和接受消息是通过同一个API进行的,其option标记了消息传递的方向:
1 | mach_msg_return_t mach_msg( |
为了实现消息的发送和接收,mach_msg()
函数实际上是调用了一个 Mach陷阱 (trap),即函数mach_msg_trap()
,陷阱这个概念在 Mach中等同于系统调用。当你在用户态调用mach_msg_trap()
时会触发陷阱机制,切换到内核态;内核态中内核实现的mach_msg()
函数会完成实际的工作,如下图:
RunLoop的核心就是一个mach_msg()
(见上面代码的第7步),RunLoop 调用这个函数去接收消息,如果没有别人发送port消息过来,内核会将线程置于等待状态。例如你在模拟器里跑起一个iOS的App,然后在App静止时点击暂停,你会看到主线程调用栈是停留在 mach_msg_trap()
这个地方。
苹果用RunLoop实现的功能
首先我们可以看一下App启动后RunLoop的状态:
1 | CFRunLoop { |
可以看到,系统默认注册了5个Mode:
kCFRunLoopDefaultMode
: App的默认Mode,通常主线程是在这个Mode下运行的。UITrackingRunLoopMode
: 界面跟踪Mode,用于ScrollView 追踪触摸滑动,保证界面滑动时不受其他Mode影响。UIInitializationRunLoopMode
: 在刚启动App时进入的第一个 Mode,启动完成后就不再使用。GSEventReceiveRunLoopMode
: 接受系统事件的内部Mode,通常用不到。kCFRunLoopCommonModes
: 这是一个占位的Mode,没有实际作用。
还有更多苹果内部的Mode,但那些Mode在开发中就很难遇到了。
当RunLoop
进行回调时,一般都是通过一个很长的函数调用出去(call out),当你在代码中下断点调试时,通常能在调用栈上看到这些函数。下面是这几个函数的整理版本,如果你在调用栈中看到这些长函数名,在这里查找一下就能定位到具体的调用地点了:
1 | { |
AutoreleasePool
App启动后,苹果在主线程RunLoop里注册了两个Observer,其回调都是 _wrapRunLoopWithAutoreleasePoolHandler()。
第一个Observer监视的事件是Entry(即将进入Loop),其回调内会调用 _objc_autoreleasePoolPush()
创建自动释放池。其order 是-2147483647,优先级最高,保证创建释放池发生在其他所有回调之前。
第二个Observer监视了两个事件:BeforeWaiting(准备进入休眠)时调用_objc_autoreleasePoolPop()
和 _objc_autoreleasePoolPush()
释放旧的池并创建新池;Exit(即将退出Loop) 时调用_objc_autoreleasePoolPop()
来释放自动释放池。这个Observer的order是2147483647,优先级最低,保证其释放池子发生在其他所有回调之后。
在主线程执行的代码,通常是写在诸如事件回调、Timer回调内的。这些回调会被RunLoop创建好的AutoreleasePool
环绕着,所以不会出现内存泄漏,开发者也不必显示创建Pool了。
事件响应
苹果注册了一个Source1(基于 mach port 的)用来接收系统事件,其回调函数为__IOHIDEventSystemClientQueueCallback()
。
当一个硬件事件(触摸/锁屏/摇晃等)发生后,首先由IOKit.framework
生成一个IOHIDEvent事件并由 SpringBoard 接收。这个过程的详细情况可以参考这里。SpringBoard只接收按键(锁屏/静音等),触摸,加速,接近传感器等几种Event,随后用mach port
转发给需要的App进程。随后苹果注册的那个Source1就会触发回调,并调用_UIApplicationHandleEventQueue()
进行应用内部的分发。
_UIApplicationHandleEventQueue()
会把 IOHIDEvent 处理并包装成UIEvent进行处理或分发,其中包括识别UIGesture/处理屏幕旋转/发送给 UIWindow 等。通常事件比如 UIButton 点击、touchesBegin/Move/End/Cancel 事件都是在这个回调中完成的。
手势识别
当上面的_UIApplicationHandleEventQueue()
识别了一个手势时,其首先会调用 Cancel 将当前的 touchesBegin/Move/End 系列回调打断。随后系统将对应的 UIGestureRecognizer 标记为待处理。
苹果注册了一个 Observer 监测 BeforeWaiting (Loop即将进入休眠) 事件,这个Observer的回调函数是 _UIGestureRecognizerUpdateObserver()
,其内部会获取所有刚被标记为待处理的GestureRecognizer,并执行GestureRecognizer的回调。
当有UIGestureRecognizer的变化(创建/销毁/状态改变)时,这个回调都会进行相应处理。
界面更新
当在操作 UI 时,比如改变了Frame、更新了UIView/CALayer的层次时,或者手动调用了UIView/CALayer的setNeedsLayout/setNeedsDisplay方法后,这个UIView/CALayer就被标记为待处理,并被提交到一个全局的容器去。
苹果注册了一个Observer监听BeforeWaiting(即将进入休眠)和Exit (即将退出Loop)事件,回调去执行一个很长的函数:_ZN2CA11Transaction17observer_callbackEP19__CFRunLoopObservermPv()
。这个函数里会遍历所有待处理的UIView/CAlayer以执行实际的绘制和调整,并更新UI界面。
这个函数内部的调用栈大概是这样的:
1 | _ZN2CA11Transaction17observer_callbackEP19__CFRunLoopObservermPv() |
定时器
NSTimer其实就是CFRunLoopTimerRef,他们之间是 toll-free bridged 的。一个NSTimer注册到RunLoop后,RunLoop会为其重复的时间点注册好事件。例如 10:00, 10:10, 10:20这几个时间点。RunLoop为了节省资源,并不会在非常准确的时间点回调这个Timer。Timer有个属性叫做Tolerance(宽容度),标示了当时间点到后,容许有多少最大误差。
如果某个时间点被错过了,例如执行了一个很长的任务,则那个时间点的回调也会跳过去,不会延后执行。就比如等公交,如果 10:10 时我忙着玩手机错过了那个点的公交,那我只能等10:20这一趟了。
CADisplayLink是一个和屏幕刷新率一致的定时器(但实际实现原理更复杂,和 NSTimer 并不一样,其内部实际是操作了一个 Source)。如果在两次屏幕刷新之间执行了一个长任务,那其中就会有一帧被跳过去(和 NSTimer相似),造成界面卡顿的感觉。在快速滑动TableView时,即使一帧的卡顿也会让用户有所察觉。Facebook开源的 AsyncDisplayLink 就是为了解决界面卡顿的问题,其内部也用到了RunLoop,这个稍后我会再单独写一页博客来分析。
PerformSelecter
当调用NSObject的performSelecter:afterDelay:
后,实际上其内部会创建一个Timer并添加到当前线程的RunLoop中。所以如果当前线程没有RunLoop,则这个方法会失效。
当调用performSelector:onThread:
时,实际上其会创建一个 Timer加到对应的线程去,同样的,如果对应线程没有RunLoop该方法也会失效。
关于GCD
实际上RunLoop底层也会用到GCD的东西,但同时GCD提供的某些接口也用到了RunLoop, 例如dispatch_async()
。
当调用dispatch_async(dispatch_get_main_queue(), block)
时,libDispatch会向主线程的RunLoop发送消息,RunLoop会被唤醒,并从消息中取得这个block,并在回调 __CFRUNLOOP_IS_SERVICING_THE_MAIN_DISPATCH_QUEUE__()
里执行这个 block。但这个逻辑仅限于dispatch到主线程,dispatch 到其他线程仍然是由libDispatch处理的。
关于网络请求
iOS 中,关于网络请求的接口自下至上有如下几层:
1 | CFSocket |
- CFSocket是最底层的接口,只负责socket通信。
- CFNetwork是基于CFSocket等接口的上层封装,ASIHttpRequest工作于这一层。
- NSURLConnection是基于CFNetwork的更高层的封装,提供面向对象的接口,AFNetworking工作于这一层。
- NSURLSession是iOS7中新增的接口,表面上是和 NSURLConnection 并列的,但底层仍然用到了NSURLConnection的部分功能 (比如 com.apple.NSURLConnectionLoader线程),AFNetworking2和 Alamofire工作于这一层。