main函数 之前的加载过程

load dylibs => Rebase => Binding => Objc => Initializers

在Xcode 中 Edit scheme -> Run -> Augments 中设置 DYLD_PRINT_STATISTICS 环境变量可以输出 main 之前执行时间。

Load dylibs

要了解第一个阶段的dylibs,先要介绍下OSX的可执行文件Mach-O

Mach-O 二进制格式

系统判断一个文件是否可以执行,是通过将文件读入内存,然后寻找一个头签名,头签名通常被称为魔数 magic,通过 magic 可以判断文件的二进制格式,如果是被支持的二进制格式,那么就可以执行该文件。

在很多可执行文件格式中,OSX 目前只支持:解释器脚本格式、通用二进制格式以及Mach-O格式。Mach-Object,简称Mach-O,是苹果在OSX中维护的一种独有的二进制格式。

Mach-O的头文件mach_header中包含magic、CPU类型和子类型等。mach_header其后包含了很多指令,这些指令被调用时清晰地指导了如何设置并加载二进制数据,这些指令被称为“加载指令”。加载指令包括将文件中的段映射到进程地址空间、调用dyld、开启线程、代码签名等。

OSX上几乎所有的程序都是动态链接的,仅有非常少量的进程只需要内核加载起就可以完成加载。通常情况下,使用dyld作为动态链接器。

Loading Dylibs 的加载过程又分为

Parse list of dependent dylibs => Find requested mach-o file => Open and read start of file => Validate mach-o => Register code signature => Call mmap() for each segment

上面说过mach_header中包含很多指令,其中包括了LC_CODE_SIGNATURE用于数字签名,iOS强制要求代码签名,且代码签名和沙盒机制是绑定在一起的,也就是说必须放到沙盒中经过签名才能运行,非越狱的机器无法自行下载一个动态库并执行。

mmap的作用是将一个文件或者其他对象映射到内存,普通文件被映射到进程地址空间后,进程可以像访问普通内存一样对文件进行访问。

通常一个 App 需要加载 100 – 400 个 dylibs,但是其中的系统库加载会被优化,能在很快的时间内加载完成

优化 Load dylibs 过程

减少非系统的依赖合并非系统库

Rebase/Binding

由于进程是在自己私有的虚拟地址空间中启动,按照传统方式,该地址是固定可预见的,所以黑客只要找到一段进程的地址,就很容易推算出整个程序的地址空间布局。所以大部分操作系统都采用了地址空间布局随机化(ASLR)的技术,避免攻击防护。

Rebase就是系统为了解决动态虚拟地址冲突,在加载动态库时进行的基地址重定位操作,Rebase是如何工作呢?我们先看下内存中的段(segment)是什么样的。

内存分为以下几个段

““
__PAGEZERO: 32位系统中,这是内存中单独的一个页面 (4KB)。64位系统中,这个段对应了一个完整的 32 位地址空间,即前 4GB。这个段有助于捕捉空指针引用,或捕捉将整数当做指针引用。
__TEXT: 存放程序代码,只读可执行,由于该段数据是只读的,同一个程序的多个实例可以仅使用一份 __TEXT 副本,从而可以优化内存
__LINKEDIT: 由 dyld 使用,包含了字符串、符号表以及其他数据
__DATA: 可读可写的数据…
“`

LINKEDIT 段中保存了 Rebase 的相关信息,dylib 中的 LC_DYLD_INOF_ONLY 指定 rebase info 在文件中的偏移量。

使用以下命令可以输出 rebase 信息xcrun dyldinfo -rebase -bind -lazy_bind myapp.app/myapp
Mach-O 中包含了很多外部库和符号的引用,使用动态链接器加载外部库和符号的过程叫做符号绑定 binding。

优化Rebase/Binding过程

减少_DATA指针
减少OC的metadata,可以删除无用的class,selector,category减少C++虚函数使用Swift的struct为不需要写的属性添加readonly

Objc

大部分Objc的设置工作都在Rebase和Binding时做完类的定义被注册实例变量偏移的更新Category被插入到方法列表Seletor的唯一性

Initializers

C++为静态变量初始化执行+load方法执行main()

优化 Initializers 过程

减少 +load() 方法,尽量使用 +initialize() 代替

使用 dispatch_one() pthread_once() std::once() 代替 C/C++ attribute(constructor)

减少静态构造函数

初始化方法中不要使用 dlopen()初始化方法中不要创建线程

总结优化的点

减少非系统的framework依赖,如果framework 在当前 App 支持的所有 iOS 系统版本中都存在则设为 required,否则设置为 optional,optional 会有额外检查合并非系统库

删除无用的 class/selector/category

删除无用的方法调用、静态变量等减少 C++ 虚函数(减少创建虚函数表时间)

使用 Swift 的 struct (从而减少符号数量)

为不需要写的属性添加 readonly减少 +load() 方法,尽量使用 +initialize() 代替使用

dispatch_one() pthread_once() std::once() 代替 C/C++ attribute(constructor)
减少静态构造函数

初始化方法中不要使用 dlopen()