sakuraのAFL源码全注释(二)

 

afl-fast-clang中叙

afl-llvm-rt

AFL LLVM_Mode中存在着三个特殊的功能。这三个功能的源码位于afl-llvm-rt.o.c中。

deferred instrumentation

AFL会尝试通过仅执行一次目标二进制文件来优化性能。它会暂停控制流,然后复制该“主”进程以持续提供fuzzer的目标。该功能在某些情况下可以减少操作系统、链接与libc内部执行程序的成本。
选好位置后,将下述代码添加到该位置上,之后使用afl-clang-fast重新编译代码即可

#ifdef __AFL_HAVE_MANUAL_CONTROL
  __AFL_INIT();
#endif

__AFL_INIT()内部调用__afl_manual_init函数。该函数的源代码如下

void __afl_manual_init(void) {
  static u8 init_done;

  if (!init_done) {

    __afl_map_shm();
    __afl_start_forkserver();
    init_done = 1;

  }

}

如果还没有被初始化,就初始化共享内存,然后开始执行forkserver,然后设置init_done为1。

__afl_map_shm就是简单的通过读取环境变量SHM_ENV_VAR来获取共享内存,然后将地址赋值给__afl_area_ptr。否则,默认的__afl_area_ptr指向的是一个数组。

__afl_start_forkserver的逻辑稍微复杂,分条叙述

  • 首先设置child_stopped为0,然后通过FORKSRV_FD + 1向状态管道写入4个字节,告知AFL fuzz已经准备好了。
  • 然后进入fuzz loop循环
    • 通过read从控制管道FORKSRV_FD读取4个字节,如果当前管道中没有内容,就会堵塞在这里,如果读到了,就代表AFL命令我们fork server去执行一次fuzz
    • 如果child_stopped为0,则直接fork出一个子进程去进行fuzz
      • 然后此时对于子进程就会关闭和控制管道和状态管道相关的fd,然后return跳出fuzz loop,恢复正常执行。
    • 如果child_stopped为1,这是对于persistent mode的特殊处理,此时子进程还活着,只是被暂停了,所以可以通过kill(child_pid, SIGCONT)来简单的重启,然后设置child_stopped为0。
    • 然后fork server向状态管道FORKSRV_FD + 1写入子进程的pid,然后等待子进程结束,注意这里对于persistent mode,我们会设置waitpid的第三个参数为WUNTRACED,代表若子进程进入暂停状态,则马上返回。
    • WIFSTOPPED(status)宏确定返回值是否对应于一个暂停子进程,因为在persistent mode里子进程会通过SIGSTOP信号来暂停自己,并以此指示运行成功,所以在这种情况下,我们需要再进行一次fuzz,就只需要和上面一样,通过SIGCONT信号来唤醒子进程继续执行即可,不需要再进行一次fuzz。
      • 设置child_stopped为1。
    • 当子进程结束以后,向状态管道FORKSRV_FD + 1写入4个字节,通知AFL这次target执行结束了。

persistent mode

上面我们其实已经介绍过persistent mode的一些特点了,那就是它并不是通过fork出子进程去进行fuzz的,而是认为当前我们正在fuzz的API是无状态的,当API重置后,一个长期活跃的进程就可以被重复使用,这样可以消除重复执行fork函数以及OS相关所需要的开销。
所以的使用方法如下:

while (__AFL_LOOP(1000)) {
  /* Read input data. */
  /* Call library code to be fuzzed. */
  /* Reset state. */
}
/* Exit normally */

循环次数不能设置过大,因为较小的循环次数可以将内存泄漏和类似故障的影响降到最低。所以循环次数设置成1000是个不错的选择。

接下来我们来解读一下源码,首先介绍一个__attribute__ constructor,demo如下,代表被此修饰的函数将在main执行之前自动运行

__attribute__((constructor(1))) void before_main1(){
    printf("before_main1\n");
}
__attribute__((constructor(2))) void before_main2(){
    printf("before_main2\n");
}
__attribute__((destructor(1))) void after_main1(){
    printf("after_main1\n");
}
__attribute__((destructor(2))) void after_main2(){
    printf("after_main2\n");
}
int main(){
    printf("main\n");
}
...
...
before_main1
before_main2
main
after_main2
after_main1

llvm mode里有一个函数__attribute__((constructor(CONST_PRIO))) void __afl_auto_init(void),其逻辑如下

  • 读取环境变量PERSIST_ENV_VAR的值,设置给is_persistent
  • 读取环境变量DEFER_ENV_VAR的值,如果为1,就直接返回,这代表__afl_auto_init和deferred instrumentation不通用,这其实道理也很简单,因为deferred instrumentation会自己选择合适的时机,手动init,不需要用这个函数来init,所以这个函数只在没有手动init的时候会自动init。
  • 执行__afl_manual_init函数,其含义见上文。

宏定义__AFL_LOOP内部调用__afl_persistent_loop函数。
__afl_persistent_loop(unsigned int max_cnt)的逻辑如下

  • 如果是第一次执行loop
    • 如果is_persistent为1
      • 清空__afl_area_ptr,设置__afl_area_ptr[0]为1,__afl_prev_loc为0
    • 设置cycle_cnt的值为传入的max_cnt参数,然后直接返回1
  • 如果不是第一次执行loop
    • 如果cycle_cnt减一(代表需要执行的循环次数减一)后大于0
      • 发出信号SIGSTOP来让当前进程暂停
      • 设置__afl_area_ptr[0]为1,__afl_prev_loc为0,然后直接返回1
    • 如果cycle_cnt为0
      • 设置__afl_area_ptr指向一个无关数组__afl_area_initial

我们将这些联系在一起,重新梳理一遍
假设我们是这么使用的:

while (__AFL_LOOP(1000)) {
    fuzzAPI();
}
  • 首先在main函数之前读取共享内容,然后以当前进程为fork server,去和AFL fuzz通信。
  • 当AFL fuzz通知进行一次fuzz,由于此时child_stopped为0,则fork server先fork出一个子进程。
  • 这个子进程会很快执行到__AFL_LOOP包围的代码,因为是第一次执行loop,所以会先清空__afl_area_ptr和设置__afl_prev_loc为0,并向共享内存的第一个元素写一个值,然后设置循环次数1000,随后返回1,此时while(__AFL_LOOP)满足条件,于是执行一次fuzzAPI。
  • 然后因为是while循环,会再次进入__AFL_LOOP里,此时将循环次数减一,变成999,然后发出信号SIGSTOP来让当前进程暂停,因为我们设置了WUNTRACED,所以waitpid函数就会返回,fork server将继续执行。
  • fork server在收到SIGSTOP信号后就知道fuzzAPI已经被成功执行结束了,就设置child_stopped为1,并告知AFL fuzz
  • 然后当AFL fuzz通知再进行一次fuzz的时候,fork server将不再需要去fork出一个新的子进程去进行fuzz,只需要恢复之前的子进程继续执行,并设置child_stopped为0
  • 因为我们是相当于重新执行一次程序,所以将__afl_prev_loc设置为0,并向共享内存的第一个元素写一个值,随后直接返回1,此时while(__AFL_LOOP)满足条件,于是执行一次fuzzAPI,然后因为是while循环,会再次进入__AFL_LOOP里,再次减少一次循环次数变成998,并发出信号暂停。
  • 上述过程重复执行,直到第1000次执行时,先恢复执行,然后返回1,然后执行一次fuzzAPI,然后因为是while循环,会再次进入__AFL_LOOP里,再次减少一次循环次数变成0,此时循环次数cnt已经被减到0,就不会再发出信号暂停子进程,而是设置__afl_area_ptr指向一个无关数组__afl_area_initial,随后将子进程执行到结束。
    • 这是因为程序依然会向后执行并触发到instrument,这会向__afl_area_ptr里写值,但是此时我们其实并没有执行fuzzAPI,我们并不想向共享内存里写值,于是将其指向一个无关数组,随意写值。同理,在deferred instrumentation模式里,在执行__afl_manual_init之前,也是向无关数组里写值,因为我们将fork点手动设置,就代表在这个fork点之前的path我们并不关心。
    • 重新整理一下上面的逻辑
      • loop第一次执行的时候,会初始化,然后返回1,执行一次fuzzAPI,然后cnt会减到999,然后抛出信号暂停子进程。
      • loop第二次执行的时候,恢复执行,清空一些值,然后返回1,执行一次fuzzAPI,然后cnt会减到998,然后抛出信号暂停子进程。
      • loop第1000次执行的时候,恢复执行,清空一些值,然后返回1,执行一次fuzzAPI,然后cnt会减到0,然后就设置指向无关数组,返回0,while循环结束,程序也将执行结束。
  • 此时fork server将不再收到SIGSTOP信号,于是child_stopped仍为0。
  • 所以当AFL fuzz通知fork server再进行一次fuzz的时候,由于此时child_stopped为0,则fork server会先fork出一个子进程,然后后续过程和之前一样了。
  • 有点绕,可以结合代码再读一下
    int __afl_persistent_loop(unsigned int max_cnt) {
    static u8  first_pass = 1;
    static u32 cycle_cnt;
    if (first_pass) {
      if (is_persistent) {
        memset(__afl_area_ptr, 0, MAP_SIZE);
        __afl_area_ptr[0] = 1;
        __afl_prev_loc = 0;
      }
      cycle_cnt  = max_cnt;
      first_pass = 0;
      return 1;
    }
    if (is_persistent) {
      if (--cycle_cnt) {
        raise(SIGSTOP);
        __afl_area_ptr[0] = 1;
        __afl_prev_loc = 0;
        return 1;
      } else {
        __afl_area_ptr = __afl_area_initial;
      }
    }
    return 0;
    }
    

trace-pc-guard mode

要使用这个功能,需要先通过AFL_TRACE_PC=1来定义DUSE_TRACE_PC宏,从而在执行afl-clang-fast的时候传入-fsanitize-coverage=trace-pc-guard参数,来开启这个功能,和之前我们的插桩不同,开启了这个功能之后,我们不再是仅仅只对每个基本块插桩,而是对每条edge都进行了插桩。

ifdef AFL_TRACE_PC
  CFLAGS    += -DUSE_TRACE_PC=1
endif

__sanitizer_cov_trace_pc_guard这个函数将在每个edge调用,该函数利用函数参数guard指针所指向的uint32值来确定共享内存上所对应的地址。
每个edge上都有应该有其不同(但其实可能相同,原因下述)的guard值

void __sanitizer_cov_trace_pc_guard(uint32_t* guard) {
  __afl_area_ptr[*guard]++;
}

而这个guard指针的初始化在__sanitizer_cov_trace_pc_guard_init函数里,llvm会设置guard其首末分别为start和stop。
它会从第一个guard开始向后遍历,设置guard指向的值,这个值是通过R(MAP_SIZE)设置的,定义如下,所以如果我们的edge足够多,而MAP_SIZE不够大,就有可能重复,而这个加一是因为我们会把0当成一个特殊的值,其代表对这个edge不进行插桩。
这个init其实很有趣,我们可以打印输出一下stop-start的值,就代表了llvm发现的程序里总计的edge数。

#  define R(x) (random() % (x))
...
...
  *(start++) = R(MAP_SIZE - 1) + 1;

  while (start < stop) {

    if (R(100) < inst_ratio) *start = R(MAP_SIZE - 1) + 1;
    else *start = 0;

    start++;

  }

 

afl-fuzz长叙

初始配置

setup_signal_handlers

注册必要的信号处理函数

  • Linux进程间通信(一):信号 signal()、sigaction()
  • SIGHUP/SIGINT/SIGTERM
    • hangup/interrupt/software termination signal from kill
    • 主要是”stop”的处理函数
    • handle_stop_sig
      • 设置stop_soon为1
      • 如果child_pid存在,向其发送SIGKILL终止信号,从而被系统杀死。
      • 如果forksrv_pid存在,向其发送SIGKILL终止信号
  • SIGALRM
    • alarm clock
    • 处理超时的情况
    • handle_timeout
      • 如果child_pid>0,则设置child_timed_out为1,并kill掉child_pid
      • 如果child_pid==-1,且forksrv_pid>0,则设置child_timed_out为1,并kill掉forksrv_pid
  • SIGWINCH
    • Window resize
    • 处理窗口大小的变化信号
    • handle_resize
      • 设置clear_screen=1
  • SIGUSR1
    • user defined signal 1,这个是留给用户自定义的信号
    • 这里定义成skip request (SIGUSR1)
    • handle_skipreq
      • 设置skip_requested=1
  • SIGTSTP/SIGPIPE
    • stop signal from tty/write on a pipe with no one to read it
    • 不关心的一些信号
    • SIG_IGN

check_asan_opts

check asan选项

  • 读取环境变量ASAN_OPTIONS和MSAN_OPTIONS,做一些检查

fix_up_sync

如果通过-M或者-S指定了sync_id,则更新out_dir和sync_dir的值

  • 设置sync_dir的值为out_dir
  • 设置out_dir的值为out_dir/sync_id

save_cmdline

拷贝当前的命令行参数

   00 ff 00 ff   55 00 00 00   buf-> 2f 55 73 65   72 73 2f 73   │ ····U···/Users/s │
   61 6b 75 72   61 2f 67 69   74 73 6f 75   72 63 65 2f   │ akura/gitsource/ │
   41 46 4c 2f   63 6d 61 6b   65 2d 62 75   69 6c 64 2d   │ AFL/cmake-build- │
   64 65 62 75   67 2f 61 66   6c 2d 66 75   7a 7a 20 2d   │ debug/afl-fuzz - │
   69 20 69 6e   70 75 74 20   2d 6f 20 6f   75 74 70 75   │ i input -o outpu │
   74 20 2d 2d   20 2e 2f 74   65 73 74 00   00 f0 00 00   │ t -- ./test·····

fix_up_banner

修剪并且创建一个运行横幅

check_if_tty

检查是否在tty终端上面运行。

  • 读取环境变量AFL_NO_UI的值,如果为真,则设置not_on_tty为1,并返回
  • ioctl(1, TIOCGWINSZ, &ws)通过ioctl来读取window size,如果报错为ENOTTY,则代表当前不在一个tty终端运行,设置not_on_tty

get_core_count

计数logical CPU cores

check_crash_handling

check_cpu_governor

setup_post

setup_shm

配置共享内存和virgin_bits

  • Linux进程间通信(六):共享内存 shmget()、shmat()、shmdt()、shmctl()
  • 如果in_bitmap为空,则通过memset初始化数组virgin_bits[MAP_SIZE]的每个元素的值为’255’(\xff)
  • 通过memset设置virgin_tmout[MAP_SIZE]和virgin_crash[MAP_SIZE]的每个元素的值为’255’(\xff)
  • 调用shmget分配一块共享内存,shmget(IPC_PRIVATE, MAP_SIZE, IPC_CREAT | IPC_EXCL | 0600);,将返回的共享内存标识符保存到shm_id里。
    • int shmget(key_t key, size_t size, int shmflg);
    • 第一个参数,程序需要提供一个参数key(非0整数),它有效地为共享内存段命名,shmget()函数成功时返回一个与key相关的共享内存标识符(非负整数),用于后续的共享内存函数。调用失败返回-1.
      • 这里shm_id取值是IPC_PRIVATE,所以函数shmget()将创建一块新的共享内存
    • 第二个参数,size以字节为单位指定需要共享的内存容量
      • 这里取值为MAP_SIZE
    • 第三个参数,shmflg是权限标志
      • IPC_CREAT 如果共享内存不存在,则创建一个共享内存,否则打开操作。
      • IPC_EXCL 只有在共享内存不存在的时候,新的共享内存才建立,否则就产生错误。
      • 421分别表示,读写执行3种权限。 比如,上面的6=4+2,表示读+写。
      • 0600 每一位表示一种类型的权限,比如,第一位是表示八进制,第二位表示拥有者的权限为读写,第三位表示同组无权限,第四位表示他人无权限。
  • 注册atexit handler为remove_shm
    • remove_shm
      • shmctl(shm_id, IPC_RMID, NULL);
        • 第一个参数,shm_id是shmget()函数返回的共享内存标识符。
        • 第二个参数,command是要采取的操作,它可以取下面的三个值
          • IPC_RMID:删除共享内存段
        • 第三个参数,buf是一个结构指针
  • 使用alloc_printf(“%d”, shm_id)来创建一个字符串shm_str
     00 ff 00 ff   06 00 00 00  shm_str->36 35 35 33   38 00 f0 f0   │ ········65538··· │
    
  • 如果不是dumb_mode,则设置环境变量SHM_ENV_VAR的值为shm_str
  • trace_bits = shmat(shm_id, NULL, 0);
    • trace_bits是用做SHM with instrumentation bitmap
    • 第一次创建完共享内存时,它还不能被任何进程访问,所以通过shmat来启动对该共享内存的访问,并把共享内存连接到当前进程的地址空间。
    • void *shmat(int shm_id, const void *shm_addr, int shmflg)
      • 第一个参数,shm_id是由shmget()函数返回的共享内存标识。
      • 第二个参数,shm_addr指定共享内存连接到当前进程中的地址位置,通常为空,表示让系统来选择共享内存的地址。
      • 第三个参数,shm_flg是一组标志位,通常为0。
      • 调用成功时返回一个指向共享内存第一个字节的指针,如果调用失败返回-1.

init_count_class16

这其实是因为trace_bits是用一个字节来记录是否到达这个路径,和这个路径被命中了多少次的,而这个次数在0-255之间,但比如一个循环,它循环5次和循环6次可能是完全一样的效果,为了避免被当成不同的路径,或者说尽可能减少因为命中次数导致的区别。
在每次去计算是否发现了新路径之前,先把这个路径命中数进行规整,比如把命中5次和6次都统一认为是命中了8次,见下面这个。

static const u8 count_class_lookup8[256] = {
        [0]           = 0,
        [1]           = 1,
        [2]           = 2,
        [3]           = 4,
        [4 ... 7]     = 8,
        [8 ... 15]    = 16,
        [16 ... 31]   = 32,
        [32 ... 127]  = 64,
        [128 ... 255] = 128
};

而为什么又需要用一个count_class_lookup16呢,是因为AFL在后面实际进行规整的时候,是一次读两个字节去处理的,为了提高效率,这只是出于效率的考量,实际效果还是上面这种效果。
初始化u16 count_class_lookup16[65536]

EXP_ST void init_count_class16(void) {

    u32 b1, b2;

    for (b1 = 0; b1 < 256; b1++)
        for (b2 = 0; b2 < 256; b2++)
            count_class_lookup16[(b1 << 8) + b2] =
                    (count_class_lookup8[b1] << 8) |
                    count_class_lookup8[b2];
}

setup_dirs_fds

准备输出文件夹和fd

  • 如果sync_id存在,且创建sync_dir文件夹,设置权限为0700(读写执行)
    • 如果报错,且errno不是EEXIST,则抛出异常。
  • 创建out_dir,设置权限为0700(读写执行)
    • 如果报错,且errno不是EEXIST,则抛出异常。
      • maybe_delete_out_dir
    • 如果创建成功
      • 如果设置了in_place_resume,就抛出异常”Resume attempted but old output directory not found”
      • out_dir_fd = open(out_dir, O_RDONLY)以只读模式打开这个文件,并返回文件句柄out_dir_fd
      • 如果没有定义宏__sun
        • 如果打开out_dir失败,或者为out_dir通过flock建立互斥锁定失败,就抛出异常”Unable to flock() output directory.”
  • 建立queue文件夹
    • 创建out_dir/queue文件夹,设置权限为0700
      • 创建out_dir/queue/.state/,设置权限为0700,该文件夹主要保存用于session resume和related tasks的queue metadata
        • 创建out_dir/queue/.state/deterministic_done/,设置权限为0700,该文件夹标记过去经历过deterministic fuzzing的queue entries
        • 创建out_dir/queue/.state/auto_extras/,设置权限为0700,Directory with the auto-selected dictionary entries.
        • 创建out_dir/queue/.state/redundant_edges/,设置权限为0700,保存当前被认为是多余的路径集合
        • 创建out_dir/queue/.state/variable_behavior/,设置权限为0700,The set of paths showing variable behavior.
  • 如果sync_id存在
    • 创建out_dir/.synced/,设置权限为0700,同步文件夹,用于跟踪cooperating fuzzers.
  • 建立crashes文件夹
    • 创建out_dir/crashes文件夹,设置权限为0700,用于记录crashes
  • 建立hangs文件夹
    • 创建out_dir/hangs文件夹,设置权限为0700,用于记录hangs
  • 通常有用的文件描述符
    • dev_null_fd = open("/dev/null", O_RDWR);以读写模式打开/dev/null
    • dev_urandom_fd = open("/dev/urandom", O_RDONLY);,以只读模式打开/dev/urandom
  • 建立Gnuplot输出文件夹
    • fd = open(tmp, O_WRONLY | O_CREAT | O_EXCL, 0600);以只写方式打开out_dir/plot_data文件,如果文件不存在,就创建,并获取句柄
    • plot_file = fdopen(fd, "w");根据句柄得到FILE* plot_file
    • 向其中写入# unix_time, cycles_done, cur_path, paths_total, pending_total, pending_favs, map_size, unique_crashes, unique_hangs, max_depth, execs_per_sec\n

read_testcases

从输入文件夹中读取所有文件,然后将它们排队进行测试。

  • 尝试访问in_dir/queue文件夹,如果存在就重新设置in_dir为in_dir/queue
    • Auto-detect non-in-place resumption attempts.
  • 扫描in_dir,并将结果保存在struct dirent **nl
    • 不使用readdir,因为测试用例的顺序将随机地有些变化,并且将难以控制。
  • 遍历nl,nl[i]->d_name的值为input文件夹下的文件名字符串
    • u8 *fn = alloc_printf("%s/%s", in_dir, nl[i]->d_name);
    • u8 *dfn = alloc_printf("%s/.state/deterministic_done/%s", in_dir, nl[i]->d_name);
    • 如果shuffle_queue的值为真,且nl_cnt大于1,则shuffle_ptrs((void **) nl, nl_cnt),字面意思上就是重排nl里的指针的位置。
    • 通过文件属性过滤掉...这样的regular文件,并检查文件大小,如果文件大小大于MAX_FILE,默认是1024*1024字节,即1M
    • 通过access检查in_dir/.state/deterministic_done/nl[i]->d_name是否存在,这应该是为了用在resume恢复扫描使用
      • 如果存在就设置passed_det为1
      • 这个检查是用来判断是否这个entry已完成deterministic fuzzing。在恢复异常终止的扫描时,我们不想重复deterministic fuzzing,因为这将毫无意义,而且可能非常耗时
    • add_to_queue(fn, st.st_size, passed_det);
    • 如果queued_paths为0,则代表输入文件夹为0,抛出异常
    • 设置last_path_time为0
    • queued_at_start的值设置为queued_paths
      • Total number of initial inputs

add_to_queue(u8 *fname, u32 len, u8 passed_det)

  • queue_entry是一个链表数据结构
  • 先通过calloc动态分配一个queue_entry结构体,并初始化其fname为文件名fn,len为文件大小,depth为cur_depth + 1,passed_det为传递进来的passed_det
    q->fname = fname;
    q->len = len;
    q->depth = cur_depth + 1;
    q->passed_det = passed_det;
    
  • 如果q->depth > max_depth,则设置max_depth为q->depth
  • 如果queue_top不为空,则设置queue_top->next为q,queue_top = q;,否则q_prev100 = queue = queue_top = q;
    static struct queue_entry *queue,     /* Fuzzing queue (linked list)      */
    *queue_top, /* Top of the list                  */
    *q_prev100; /* Previous 100 marker              */
    
  • queue计数器queued_paths和待fuzz的样例计数器pending_not_fuzzed加一
  • cycles_wo_finds设置为0
    • Cycles without any new paths
  • 如果queued_paths % 100得到0,则设置q_prev100->next_100 = q; q_prev100 = q;
  • 设置last_path_time为当前时间。

load_auto

load自动生成的提取出来的词典token

  • 遍历循环从i等于0到USE_AUTO_EXTRAS,默认50
    • 以只读模式尝试打开文件名为alloc_printf("%s/.state/auto_extras/auto_%06u", in_dir, i)的文件
    • 如果打开失败,则结束
    • 如果打开成功,则从fd读取最多MAX_AUTO_EXTRA+1个字节到tmp数组里,默认MAX_AUTO_EXTRA为32,这是单个auto extra文件的最大大小,读取出的长度保存到len里。
    • maybe_add_auto(tmp, len);
      };

maybe_add_auto(u8 *mem, u32 len)

  • 如果用户设置了MAX_AUTO_EXTRAS或者USE_AUTO_EXTRAS为0,则直接返回。
  • 循环遍历i从1到len,将tmp[0]和mem[i]异或,如果相同,则结束循环。
  • 如果结束时i=0,即tmp[0]和tmp[1]就相同,就直接返回。这里我推断tmp应该是从小到大排序的字节流。
  • 如果len的长度为2,就和interesting_16数组里的元素比较,如果和其中某一个相同,就直接return。
  • 如果len的长度为4,就和interesting_32数组里的元素比较,如果和其中某一个相同,就直接return。
  • 将tmp和现有的extras数组里的元素比较,利用extras数组里保存的元素是按照size大小,从小到大排序这个特性,来优化代码。
    • 遍历extras数组,比较memcmp_nocase(extras[i].data, mem, len),如果有一个相同,就直接return。
    • static struct extra_data extras; / Extra tokens to fuzz with */
  • 设置auto_changed为1
  • 遍历a_extras数组,比较memcmp_nocase(a_extras[i].data, mem, len),如果相同,就将其hit_cnt值加一,这是代表在语料中被use的次数,然后跳转到sort_a_extras
    • static struct extra_data a_extras; / Automatically selected extras */
      struct extra_data {
      u8 *data;                           /* Dictionary token data            */
      u32 len;                            /* Dictionary token length          */
      u32 hit_cnt;                        /* Use count in the corpus          */
      
  • 此时我们可能在处理一个不在之前的任何a_extras或者extras数组里的新entry了,处理逻辑是
    • 先比较a_extras_cnt和MAX_AUTO_EXTRAS,如果小于就代表a_extras数组没有填满,直接拷贝tmp和len,来构造出一个新项,加入到a_extras数组里
    • 否则的话,就从a_extras数组的后半部分里,随机替换掉一个元素的a_extras[i].data为ck_memdup(mem, len),并将len设置为len,hit_cnt设置为0。

pivot_inputs

逻辑上说这个函数就是为inputdir里的testcase,在output dir里创建hard link

  • 初始化id=0
  • 依次遍历queue里的queue_entry
    • 在q->fname里找到最后一个’/‘所在的位置,如果找不到,则rsl = q->fname,否则rsl指向’/‘后的第一个字符,其实也就是最后一个/后面的字符串
    • 将rsl的前三个字节和id_进行比较
      • 如果相等,则设置resuming_fuzz为1,然后做一些恢复操作,不叙述。
      • 如果不相等
        • 在rsl里寻找,orig:子串,如果找到了,将use_name指向该子串的冒号后的名字;如果没找到,就另use_name = rsl
        • nfn = alloc_printf("%s/queue/id:%06u,orig:%s", out_dir, id, use_name);
        • 尝试创建从input file到alloc_printf("%s/queue/id:%06u,orig:%s", out_dir, id, use_name)的硬链接
    • 修改q的fname指向这个硬链接
    • 如果q的passed_det为1,则mark_as_det_done(q),这主要是对应上面的resuming_fuzz的情况。
      • mark_as_det_done简单的说就是打开out_dir/queue/.state/deterministic_done/use_name这个文件,如果不存在就创建这个文件,然后设置q的passed_det为1。
      • 这里的use_name就是orig:后面的字符串
  • 如果设置了in_place_resume为1,则nuke_resume_dir()
    • nuke_resume_dir()
      • 删除out_dir/_resume/.state/deterministic_done文件夹下所有id:前缀的文件
      • 删除out_dir/_resume/.state/auto_extras文件夹下所有auto_前缀的文件
      • 删除out_dir/_resume/.state/redundant_edges文件夹下所有id:前缀的文件
      • 删除out_dir/_resume/.state/variable_behavior文件夹下所有id:前缀的文件
      • 删除文件夹out_dir/_resume/.state
      • 删除out_dir/_resume文件夹下所有id:前缀的文件
      • 如果全部删除成功就正常返回,如果有某一个删除失败就抛出异常。

load_extras

如果定义了extras_dir,则从extras_dir读取extras到extras数组里,并按size排序。

find_timeout

如果timeout_given没有被设置,则进入find_timeout
这个想法是,在不指定-t的情况下resuming sessions时,我们不希望一遍又一遍地自动调整超时时间,以防止超时值因随机波动而增长

  • 如果resuming_fuzz为0,则直接return
  • 如果in_place_resume为1,则fn = alloc_printf("%s/fuzzer_stats", out_dir);,否则fn = alloc_printf("%s/../fuzzer_stats", in_dir);
  • 以只读方式打开fd,读取内容到tmp[4096]里,并在里面搜索”exec_timeout : “,如果搜索不到就直接返回,如果搜索到了,就读取这个timeout的数值,如果大于4就设置为exec_tmout的值。
    • EXP_ST u32 exec_tmout = EXEC_TIMEOUT; / Configurable exec timeout (ms) /
  • timeout_given = 3;
    • timeout_given, / Specific timeout given? /

detect_file_args

这个函数其实就是识别参数里面有没有@@,如果有就替换为out_dir/.cur_input,如果没有就返回

setup_stdio_file

如果out_file为NULL,如果没有使用-f,就删除原本的out_dir/.cur_input,创建一个新的out_dir/.cur_input,保存其文件描述符在out_fd中

check_binary

check指定路径处要执行的程序是否存在,且它不能是一个shell script

perform_dry_run

执行所有的测试用例,以检查是否按预期工作

  • 读取环境变量AFL_SKIP_CRASHES到skip_crashes,设置cal_failures为0
  • 遍历queue
    • 打开q->fname,并读取到分配的内存use_mem里
    • res = calibrate_case(argv, q, use_mem, 0, 1);
      • 校准测试用例,见下文
    • 如果stop_soon被置为1,就直接return
    • 如果res的结果为crash_mode或者FAULT_NOBITS
      • 打印SAYF("len = %u, map size = %u, exec speed = %llu us\n", q->len, q->bitmap_size, q->exec_us);
    • 依据res的结果查看是哪种错误并进行判断。一共有以下几种错误类型
      • FAULT_NONE
        • 如果q是头结点,即第一个测试用例,则check_map_coverage,用以评估map coverage
          • 计数trace_bits发现的路径数,如果小于100,就直接返回
          • 在trace_bits的数组后半段,如果有值就直接返回。
          • 抛出警告WARNF("Recompile binary with newer version of afl to improve coverage!")
        • 如果是crash_mode,则抛出异常,FATAL("Test case '%s' does *NOT* crash", fn);,该文件不崩溃
      • FAULT_TMOUT
        • 如果指定了-t参数,则timeout_given值为2
          • 抛出警告WARNF("Test case results in a timeout (skipping)");,并设置q的cal_failed为CAL_CHANCES,cal_failures计数器加一。
      • FAULT_CRASH
        • 如果没有指定mem_limit,则可能抛出建议增加内存的建议
        • 但不管指定了还是没有,都会抛出异常FATAL("Test case '%s' results in a crash", fn);
      • FAULT_ERROR
        • 抛出异常Unable to execute target application
      • FAULT_NOINST
        • 这个样例运行没有出现任何路径信息,抛出异常No instrumentation detected
      • FAULT_NOBITS
        • 如果这个样例有出现路径信息,但是没有任何新路径,抛出警告WARNF("No new instrumentation output, test case may be useless."),认为这是无用路径。useless_at_start计数器加一
    • 如果这个样例q的var_behavior为真,则代表它多次运行,同样的输入条件下,却出现不同的覆盖信息。
      • 抛出警告WARNF("Instrumentation output varies across runs.");,代表这个样例的路径输出可变
    • 然后读取下一个queue,继续测试,直到结束。
      enum {
      /* 00 */ FAULT_NONE,
      /* 01 */ FAULT_TMOUT,
      /* 02 */ FAULT_CRASH,
      /* 03 */ FAULT_ERROR,
      /* 04 */ FAULT_NOINST,
      /* 05 */ FAULT_NOBITS };
      

u8 calibrate_case(char *argv, struct queue_entry q, u8 *use_mem, u32 handicap, u8 from_queue)

这个函数评估input文件夹下的case,来发现这些testcase的行为是否异常;以及在发现新的路径时,用以评估这个新发现的testcase的行为是否是可变(这里的可变是指多次执行这个case,发现的路径不同)等等

  • 这个函数的参数为char **argv, struct queue_entry *q, u8 *use_mem, u32 handicap, u8 from_queue
  • 创建first_trace[MAP_SIZE]
  • 如果q->exec_cksum为0,代表这是这个case第一次运行,即来自input文件夹下,所以将first_run置为1。
  • 保存原有的stage_cur、stage_max、stage_name
  • 设置use_tmout为exec_tmout,如果from_queue是0或者resuming_fuzz被置为1,即代表不来自于queue中或者在resuming sessions的时候,则use_tmout的值被设置的更大。
  • q->cal_failed++
  • 设置stage_name为”calibration”,以及根据是否fast_cal为1,来设置stage_max的值为3还是CAL_CYCLES(默认为8),含义是每个新测试用例(以及显示出可变行为的测试用例)的校准周期数,也就是说这个stage要执行几次的意思。
  • 如果当前不是以dumb mode运行,且no_forkserver(禁用forkserver)为0,且forksrv_pid为0,则init_forkserver(argv)启动fork server,见后文。
  • 如果这个queue不是来自input文件夹,而是评估新case,则此时q->exec_cksum不为空,拷贝trace_bits到first_trace里,然后计算has_new_bits的值,赋值给new_bits。
  • 开始执行calibration stage,共执行stage_max轮
    • 如果这个queue不是来自input文件夹,而是评估新case,且第一轮calibration stage执行结束时,刷新一次展示界面show_stats,用来展示这次执行的结果,此后不再展示。
    • write_to_testcase(use_mem, q->len)
      • 将从q->fname中读取的内容写入到.cur_input
    • u8 run_target(argv, use_tmout),结果保存在fault中
    • 如果这是calibration stage第一次运行,且不在dumb_mode,且共享内存里没有任何路径(即没有任何byte被置位),设置fault为FAULT_NOINST,然后goto abort_calibration。
      • 计算共享内存里有多少字节被置位了,通过count_bytes函数
        • u32 count_bytes(u8 *mem)
    • 计算hash32(trace_bits, MAP_SIZE, HASH_CONST)的结果,其值为一个32位uint值,保存到cksum中
    • 如果q->exec_cksum不等于cksum,即代表这是第一次运行,或者在相同的参数下,每次执行,cksum却不同,是一个路径可变的queue
      • hnb = has_new_bits(virgin_bits)
      • 如果hnb大于new_bits,设置new_bits的值为hnb
      • 如果q->exec_cksum不等于0,即代表这是判断是否是可变queue
        • i从0到MAP_SIZE遍历,如果first_trace[i]不等于trace_bits[i],代表发现了可变queue,且var_bytes为空,则将该字节设置为1,并将stage_max设置为CAL_CYCLES_LONG,即需要执行40次。
        • 将var_detected设置为1
      • 否则,即q->exec_cksum等于0,即代表这是第一次执行这个queue
        • 设置q->exec_cksum的值为之前计算出来的本次执行的cksum
        • 拷贝trace_bits到first_trace中。
  • 保存所有轮次总的执行时间,加到total_cal_us里,总的执行轮次,加到total_cal_cycles里
  • 计算出一些统计信息,包括
    • 计算出单次执行时间的平均值保存到q->exec_us里
    • 将最后一次执行所覆盖到的路径数保存到q->bitmap_size里
    • q->handicap = handicap;
    • q->cal_failed = 0;
    • total_bitmap_size里加上这个queue所覆盖到的路径数
    • total_bitmap_entries++
    • update_bitmap_score(struct queue_entry *q)
  • 如果fault为FAULT_NONE,且该queue是第一次执行,且不属于dumb_mode,而且new_bits为0,代表在这个样例所有轮次的执行里,都没有发现任何新路径和出现异常,设置fault为FAULT_NOBITS
  • 如果new_bits为2,且q->has_new_cov为0,设置其值为1,并将queued_with_cov加一,代表有一个queue发现了新路径。
  • 如果这个queue是可变路径,即var_detected为1,则计算var_bytes里被置位的tuple个数,保存到var_byte_count里,代表这些tuple具有可变的行为。
  • 将这个queue标记为一个variable
    • mark_as_variable(struct queue_entry *q)
      • 创建符号链接out_dir/queue/.state/variable_behavior/fname
      • 设置queue的var_behavior为1
    • 计数variable behavior的计数器queued_variable的值加一
  • 恢复之前的stage值
  • 如果不是第一次运行这个queue,展示show_stats
  • 返回fault的值

init_forkserver

  • 建立管道st_pipe和ctl_pipe,在父子进程之间,是通过管道进行通信,一个用于传递状态,另一个用于传递命令。
  • fork出一个子进程,fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。
    • forksrv_pid = fork()
  • 子进程和父进程都会向下执行,我们通过pid来使它们执行不同的代码if(!forksrv_pid)
    • 以下都是子进程要执行的代码
      • 在继续向下读之前,需要仔细阅读这篇文章
      • 重定向文件描述符1和2到dev_null_fd,如果指定了out_file,则文件描述符0重定向到dev_null_fd,否则重定向到out_fd。
        • dup2(dev_null_fd, 1);
        • dup2(dev_null_fd, 2);
      • 重定向FORKSRV_FD到ctl_pipe[0],重定向FORKSRV_FD + 1到st_pipe[1]
        • 子进程只能读取命令
        • 子进程只能发送(“写出”)状态
      • 关闭子进程里的一些文件描述符
        close(ctl_pipe[0]);
        close(ctl_pipe[1]);
        close(st_pipe[0]);
        close(st_pipe[1]);
        
        close(out_dir_fd);
        close(dev_null_fd);
        close(dev_urandom_fd);
        close(fileno(plot_file));
        
      • 读取环境变量LD_BIND_LAZY,如果没有设置,则设置环境变量LD_BIND_NOW为1
      • 设置环境变量ASAN_OPTIONS为"abort_on_error=1:" "detect_leaks=0:" "symbolize=0:" "allocator_may_return_null=1",同理设置MSAN_OPTIONS
      • execv(target_path, argv)带参数执行target,这个函数除非出错不然不会返回。
        • execv会替换掉原有的进程空间为target_path代表的程序,所以相当于后续就是去执行target_path,这个程序结束的话,子进程就结束。
        • 而在这里非常特殊,第一个target会进入__afl_maybe_log里的__afl_fork_wait_loop,并充当fork server,在整个Fuzz的过程中,它都不会结束,每次要Fuzz一次target,都会从这个fork server fork出来一个子进程去fuzz。
      • 使用一个独特的bitmaps EXEC_FAIL_SIG(0xfee1dead)写入trace_bits,来告诉父进程执行失败,并结束子进程。
  • 以下都是父进程要执行的代码
    • 关闭不需要的endpoints
        // 关闭不是需要的endpoints
        close(ctl_pipe[0]);
        close(st_pipe[1]);
      
        fsrv_ctl_fd = ctl_pipe[1];//父进程只能发送("写出")命令
        fsrv_st_fd = st_pipe[0];//父进程只能读取状态
      
    • 等待fork server启动,但是不能等太久。(所以在调试时要注意这个…)
      • 从管道里读取4个字节到status里,如果读取成功,则代表fork server成功启动,就结束这个函数并返回。
      • 如果超时,就抛出异常。
  • 后续是一些子进程启动失败的异常处理逻辑,暂时不叙。

has_new_bits(u8 *virgin_map)

  • 检查有没有新路径或者某个路径的执行次数有所不同。
  • 初始化current和virgin为trace_bits和virgin_map的u64首元素地址,设置ret的值为0
  • 8个字节一组,每次从trace_bits,也就是共享内存里取出8个字节
    • 如果current不为0,且current & virgin不为0,即代表current发现了新路径或者某条路径的执行次数和之前有所不同
      • 如果ret当前小于2
        • 取current的首字节地址为cur,virgin的首字节地址为vir
        • i的范围是0-7,比较cur[i] && vir[i] == 0xff,如果有一个为真,则设置ret为2
          • 这代表发现了之前没有出现过的tuple
          • 注意==的优先级比&&要高,所以先判断vir[i]是否是0xff,即之前从未被覆盖到,然后再和cur[i]进行逻辑与
        • 否则设置ret为1
          • 这代表仅仅只是改变了某个tuple的hit-count
      • *virgin &= ~*current
    • current和virgin移动到下一组8个字节,直到MAPSIZE全被遍历完。
  • 如果传入给has_new_bits的参数virgin_mapvirgin_bits,且ret不为0,就设置bitmap_changed为1
    • virgin_bits保存还没有被Fuzz覆盖到的byte,其初始值每位全被置位1,然后每次按字节置位。
  • 返回ret的值。

u32 count_bytes(u8 *mem)

  • 初始化计数器ret的值为0,循环读取mem里的值,每次读取4个字节到u32变量v中
  • 如果v为0,则代表这四个字节都是0,直接跳过,进入下一次循环
  • 如果v不为0,则依次计算v & FF(0),v & FF(1),v & FF(2),v&FF(3)的结果,如果不为0,则计数器ret加一。
    • #define FF(_b) (0xff << ((_b) << 3))
      • (_b) << 3)_b * 8
      • 0x000000ff左移(_b * 8)
      • 最终结果可以是0x000000ff,0x0000ff00,0x00ff0000,0xff000000其中之一

u8 run_target(char **argv, u32 timeout)

  • 先清空trace_bits[MAP_SIZE],将其全置为0,也就是清空共享内存。
  • 如果dumb_mode等于1,且no_forkserver,则直接fork出一个子进程,然后让子进程execv去执行target,如果execv执行失败,则向trace_bits写入EXEC_FAIL_SIG
  • 否则,就向控制管道写入prev_timed_out的值,命令Fork server开始fork出一个子进程进行fuzz,然后从状态管道读取fork server返回的fork出的子进程的ID到child_pid
  • 无论实际执行的是上面两种的哪一种,在执行target期间,都设置计数器为timeout,如果超时,就杀死正在执行的子进程,并设置child_timed_out为1;
  • 计算target执行时间exec_ms,并将total_execs这个执行次数计数器加一。
  • 等待target执行结束,如果是dumb_mode,target执行结束的状态码将直接保存到status中,如果不是dumb_mode,则从状态管道中读取target执行结束的状态码。
  • classify_counts((u64 *) trace_bits)
    • 具体地,target是将每个分支的执行次数用1个byte来储存,而fuzzer则进一步把这个执行次数归入到buckets中,举个例子,如果某分支执行了1次,那么落入第2个bucket,其计数byte仍为1;如果某分支执行了4次,那么落入第5个bucket,其计数byte将变为8,等等。
    • 这样处理之后,对分支执行次数就会有一个简单的归类。例如,如果对某个测试用例处理时,分支A执行了32次;对另外一个测试用例,分支A执行了33次,那么AFL就会认为这两次的代码覆盖是相同的。当然,这样的简单分类肯定不能区分所有的情况,不过在某种程度上,处理了一些因为循环次数的微小区别,而误判为不同执行结果的情况.
  • 设置prev_timed_out的值为child_timed_out。
  • 接着依据status的值,向调用者返回结果。
    • WIFSIGNALED(status)若为异常结束子进程返回的状态,则为真
      • WTERMSIG(status)取得子进程因信号而中止的信号代码
        • 如果child_timed_out为1,且状态码为SIGKILL,则返回FAULT_TMOUT
        • 否则返回FAULT_CRASH
    • 如果是dumb_mode,且trace_bits为EXEC_FAIL_SIG,就返回FAULT_ERROR
    • 如果timeout小于等于exec_tmout,且slowest_exec_ms小于exec_ms,设置slowest_exec_ms等于exec_ms
    • 返回FAULT_NONE

classify_counts(u64 *mem)

  • 8个字节一组去循环读入,直到遍历完整个mem
    • 每次取两个字节u16 *mem16 = (u16 *) mem
    • i从0到3,计算mem16[i]的值,在count_class_lookup16[mem16[i]]里找到对应的取值,并赋值给mem16[i]

update_bitmap_score(struct queue_entry *q)

每当我们发现一个新的路径,都会调用这个函数来判断其是不是更加地favorable,这个favorable的意思是说是否包含最小的路径集合来遍历到所有bitmap中的位,我们专注于这些集合而忽略其他的。

  • 首先计算出这个case的fav_factor,计算方法是q->exec_us * q->len即执行时间和样例大小的乘积,以这两个指标来衡量权重。
  • 遍历trace_bits数组,如果该字节的值不为0,则代表这是已经被覆盖到的path
    • 然后检查对应于这个path的top_rated是否存在
      • static struct queue_entry *top_rated[MAP_SIZE]; /* Top entries for bitmap bytes */
      • 如果存在,就比较fav_factor > top_rated[i]->exec_us * top_rated[i]->len,即比较执行时间和样例大小的乘积,哪个更小。
        • 如果top_rated[i]的更小,则代表top_rated[i]的更优,不做任何处理,继续遍历下一个path。
        • 如果q更小,就将top_rated[i]原先对应的queue entry的tc_ref字段减一,并将其trace_mini字段置为空。
        • u8 *trace_mini; /* Trace bytes, if kept */
        • u32 tc_ref; /* Trace bytes ref count */
      • 然后设置top_rated[i]为q,即当前case,然后将其tc_ref的值加一
      • 如果q->trace_mini为空,则将trace_bits经过minimize_bits压缩,然后存到trace_mini字段里
      • 设置score_changed为1.

void minimize_bits(u8 dst, u8 src)

将trace_bits压缩为较小的位图。
简单的理解就是把原本是包括了是否覆盖到和覆盖了多少次的byte,压缩成是否覆盖到的bit。
在看这个函数和下一个函数cull_queue之前,建议把经典算法系列之(一) – BitMap [数据的压缩存储]读完。

static void minimize_bits(u8 *dst, u8 *src) {

    u32 i = 0;

    while (i < MAP_SIZE) {

        if (*(src++)) dst[i >> 3] |= 1 << (i & 7);
        i++;

    }

}

虽然dst是一个bitmap,但是实际上在这里我们还是用一个byte数组来操作它,所以就首先得做byte->bit的映射,比如说将src的前0-7个字节映射到dst的第一个字节(0-7位)

>>> 0>>3
0
>>> 1>>3
0
>>> 2>>3
0
...
>>> 7>>3
0
>>> 8>>3
1

然后如果src里该字节的值不为0,i此时就代表这个字节的index索引,其与0000 0111相与,最终的结果都只在0-7之间,这样我们就可以知道这个index在0-7之间对应的具体的bit是哪一个,最后通过或运算将该位置位。

>>> 0&7
0
>>> 1&7
1
>>> 2&7
2
>>> 3&7
3
>>> 4&7
4
>>> 5&7
5
>>> 6&7
6
>>> 7&7
7
>>> 8&7
0
>>> 9&7
1

cull_queue

精简队列

  • 如果score_changed为0,即top_rated没有变化,或者dumb_mode,就直接返回
  • 设置score_changed的值为0
  • 创建u8 temp_v数组,大小为MAP_SIZE除8,并将其初始值设置为0xff,其每位如果为1就代表还没有被覆盖到,如果为0就代表以及被覆盖到了。
  • 设置queued_favored为0,pending_favored为0
  • 开始遍历queue队列,设置其favored的值都为0
  • 将i从0到MAP_SIZE迭代,这个迭代其实就是筛选出一组queue entry,它们就能够覆盖到所有现在已经覆盖到的路径,而且这个case集合里的case要更小更快,这并不是最优算法,只能算是贪婪算法。
    • 这又是个不好懂的位运算,temp_v[i >> 3] & (1 << (i & 7))与上面的差不多,中间的或运算改成了与,是为了检查该位是不是0,即判断该path对应的bit有没有被置位。
      for (i = 0; i < MAP_SIZE; i++)
        if (top_rated[i] && (temp_v[i >> 3] & (1 << (i & 7)))) {
      ...
      
    • 如果top_rated[i]有值,且该path在temp_v里被置位
      • 就从temp_v中清除掉所有top_rated[i]覆盖到的path,将对应的bit置为0
      • 设置top_rated[i]->favored为1,queued_favored计数器加一
      • 如果top_rated[i]的was_fuzzed字段是0,代表其还没有fuzz过,则将pending_favored计数器加一
    • 遍历queue队列
      • mark_as_redundant(q, !q->favored)
        • 也就是说,如果不是favored的case,就被标记成redundant_edges

mark_as_redundant(struct queue_entry *q, u8 state)

  • 如果state和q->fs_redundant相等,就直接返回
  • 设置q->fs_redundant的值为state,
  • 如果state为1
    • 尝试创建out_dir/queue/.state/redundant_edges/fname
  • 如果state为0
    • 尝试删除out_dir/queue/.state/redundant_edges/fname

show_init_stats

在处理输入目录的末尾显示统计信息,以及一堆警告,以及几个硬编码的常量。

  • 依据之前从calibrate_case里得到的total_cal_us和total_cal_cycles,计算出单轮执行的时间avg_us,如果大于10000,就警告"The target binary is pretty slow! See %s/perf_tips.txt."
    • 如果avg_us大于50000,设置havoc_div为10 / 0-19 execs/sec /
    • 大于20000,设置havoc_div为5 / 20-49 execs/sec /
    • 如果大于10000,设置havoc_div为2 / 50-100 execs/sec /
  • 如果不是resuming session,则对queue的大小和个数超限提出警告,且如果useless_at_start不为0,就警告有可以精简的样本。
  • 如果timeout_given为0,则根据avg_us来计算出exec_tmout,注意这里avg_us的单位是微秒,而exec_tmout单位是毫秒,所以需要除以1000
    • avg_us > 50000
      • exec_tmout = avg_us * 2 / 1000
    • avg_us > 10000
      • exec_tmout = avg_us * 3 / 1000
    • exec_tmout = avg_us * 5 / 1000
    • 然后在上面计算出来的exec_tmout和所有样例中执行时间最长的样例进行比较,取最大值赋给exec_tmout
    • 如果exec_tmout大于EXEC_TIMEOUT,就设置exec_tmout = EXEC_TIMEOUT
      • EXEC_TIMEOUT的值为1秒,即最大超时时间是1秒
    • 打印出"No -t option specified, so I'll use exec timeout of %u ms.", exec_tmout
    • 设置timeout_given为1
  • 如果timeout_give不为0,且为3,代表这是resuming session,直接打印"Applying timeout settings from resumed session (%u ms).", exec_tmout,此时的timeout_give是我们从历史记录里读取出的。
  • 如果是dumb_mode且没有设置环境变量AFL_HANG_TMOUT
    • 设置hang_tmout为EXEC_TIMEOUT和exec_tmout * 2 + 100中的最小值
  • All set and ready to roll!

find_start_position

resume时,请尝试查找要从其开始的队列位置,这仅在resume时以及当我们可以找到原始的fuzzer_stats时才有意义.

  • 如果不是resuming_fuzz,就直接返回
  • 如果是in_place_resume,就打开out_dir/fuzzer_stats文件,否则打开in_dir/../fuzzer_stats文件
  • 读这个文件的内容到tmp[4096]中,找到cur_path,并设置为ret的值,如果大于queued_paths就设置ret为0,返回ret。

void write_stats_file(double bitmap_cvg, double stability, double eps)

更新统计信息文件以进行无人值守的监视

  • 创建文件out_dir/fuzzer_stats
  • 写入统计信息
  • start_time
    • fuzz运行的开始时间,start_time / 1000
  • last_update
    • 当前时间
  • fuzzer_pid
    • 获取当前pid
  • cycles_done
    • queue_cyclequeue_cur为空,即执行到当前队列尾的时候才增加1,所以这代表queue队列被完全变异一次的次数。
  • execs_done
    • total_execs,target的总的执行次数,每次run_target的时候会增加1
  • execs_per_sec
    • 每秒执行的次数
  • paths_total
    • queued_paths在每次add_to_queue的时候会增加1,代表queue里的样例总数
  • paths_favored
    • queued_favored,有价值的路径总数
  • paths_found
    • queued_discovered在每次common_fuzz_stuff去执行一次fuzz时,发现新的interesting case的时候会增加1,代表在fuzz运行期间发现的新queue entry。
  • paths_imported
    • queued_imported是master-slave模式下,如果sync过来的case是interesting的,就增加1
  • max_depth
    • 最大路径深度
  • cur_path
    • current_entry一般情况下代表的是正在执行的queue entry的整数ID,queue首节点的ID是0
  • pending_favs
    • pending_favored 等待fuzz的favored paths数
  • pending_total
    • pending_not_fuzzed 在queue中等待fuzz的case数
  • variable_paths
    • queued_variable在calibrate_case去评估一个新的test case的时候,如果发现这个case的路径是可变的,则将这个计数器加一,代表发现了一个可变case
  • stability
  • bitmap_cvg
  • unique_crashes
    • unique_crashes这是在save_if_interesting时,如果fault是FAULT_CRASH,就将unique_crashes计数器加一
  • unique_hangs
    • unique_hangs这是在save_if_interesting时,如果fault是FAULT_TMOUT,且exec_tmout小于hang_tmout,就以hang_tmout为超时时间再执行一次,如果还超时,就让hang计数器加一。
  • last_path
    • add_to_queue里将一个新case加入queue时,就设置一次last_path_time为当前时间,last_path_time / 1000
  • last_crash
    • 同上,在unique_crashes加一的时候,last_crash也更新时间,last_crash_time / 1000
  • last_hang
    • 同上,在unique_hangs加一的时候,last_hang也更新时间,last_hang_time / 1000
  • execs_since_crash
    • total_execs – last_crash_execs,这里last_crash_execs是在上一次crash的时候的总计执行了多少次
  • exec_tmout
    • 配置好的超时时间,有三种可能的配置方式,见上文
    fprintf(f, "start_time        : %llu\n"
               "last_update       : %llu\n"
               "fuzzer_pid        : %u\n"
               "cycles_done       : %llu\n"
               "execs_done        : %llu\n"
               "execs_per_sec     : %0.02f\n"
               "paths_total       : %u\n"
               "paths_favored     : %u\n"
               "paths_found       : %u\n"
               "paths_imported    : %u\n"
               "max_depth         : %u\n"
               "cur_path          : %u\n" /* Must match find_start_position() */
               "pending_favs      : %u\n"
               "pending_total     : %u\n"
               "variable_paths    : %u\n"
               "stability         : %0.02f%%\n"
               "bitmap_cvg        : %0.02f%%\n"
               "unique_crashes    : %llu\n"
               "unique_hangs      : %llu\n"
               "last_path         : %llu\n"
               "last_crash        : %llu\n"
               "last_hang         : %llu\n"
               "execs_since_crash : %llu\n"
               "exec_timeout      : %u\n" /* Must match find_timeout() */
               "afl_banner        : %s\n"
               "afl_version       : " VERSION "\n"
               "target_mode       : %s%s%s%s%s%s%s\n"
               "command_line      : %s\n"
               "slowest_exec_ms   : %llu\n",
            start_time / 1000, get_cur_time() / 1000, getpid(),
            queue_cycle ? (queue_cycle - 1) : 0, total_execs, eps,
            queued_paths, queued_favored, queued_discovered, queued_imported,
            max_depth, current_entry, pending_favored, pending_not_fuzzed,
            queued_variable, stability, bitmap_cvg, unique_crashes,
            unique_hangs, last_path_time / 1000, last_crash_time / 1000,
            last_hang_time / 1000, total_execs - last_crash_execs,
            exec_tmout, use_banner,
            qemu_mode ? "qemu " : "", dumb_mode ? " dumb " : "",
            no_forkserver ? "no_forksrv " : "", crash_mode ? "crash " : "",
            persistent_mode ? "persistent " : "", deferred_mode ? "deferred " : "",
            (qemu_mode || dumb_mode || no_forkserver || crash_mode ||
             persistent_mode || deferred_mode) ? "" : "default",
            orig_cmdline, slowest_exec_ms);
  • 统计子进程的资源用量并写入。

save_auto

保存自动生成的extras

  • 如果auto_changed为0,则直接返回
  • 如果不为0,就设置为0,然后创建名为alloc_printf("%s/queue/.state/auto_extras/auto_%06u", out_dir, i);的文件,并写入a_extras的内容。

通信管道基础知识

            假设进程A拥有一个已打开的文件描述符fd3,它的状态如下
            进程A的文件描述符表(before dup2)
            ------------
            fd0 0   | p0
            ------------
            fd1 1   | p1 -------------> 文件表1 ---------> vnode1
            ------------
            fd2 2   | p2
            ------------
            fd3 3   | p3 -------------> 文件表2 ---------> vnode2
            ------------
            ... ...
            ... ...
            ------------

            经下面调用:
            n_fd = dup2(fd3, STDOUT_FILENO);后进程状态如下:

            进程A的文件描述符表(after dup2)
            ------------
            fd0 0   | p0
            ------------
            n_fd 1  | p1 ------------
            ------------               \
            fd2 2   | p2                  \
            ------------                 _\|
            fd3 3   | p3 -------------> 文件表2 ---------> vnode2

            在学习dup2时总是碰到“重定向”一词,上图完成的就是一个“从标准输出到文件的重定向”,经过dup2后进程A的任何目标为STDOUT_FILENO的I/O操作如printf等,其数据都将流入fd3所对应的文件中。下面是一个例子程序:
            #define TESTSTR "Hello dup2\n"
            int main() {
                    int     fd3;

                    fd3 = open("testdup2.dat", 0666);
                    if (fd < 0) {
                            printf("open error\n");
                            exit(-1);
                    }

                    if (dup2(fd3, STDOUT_FILENO) < 0) {       
                            printf("err in dup2\n");
                    }
                    printf(TESTSTR);
                    return 0;
            }
            其结果就是你在testdup2.dat中看到"Hello dup2"。
(完)