函数指针和回调函数

By JiangLingJun

post-cover

参考链接1:指针函数和函数指针-作者:chenyc4
参考链接2:C++函数指针详解-作者:羽裳有涯
参考链接3:回调函数(callback)是什么-作者:no.bady

此篇博客是由日常学习、阅读,参考其他优秀博客总结而成,旨在通过文字结合实例的方式来理解回调函数。
目录一览:

  • 指针函数与函数指针
  • 函数指针应用实例-回调函数

一、指针函数与函数指针

首先明确这两个概念,指针函数中定语是“指针”,被修饰的名词是“函数”,所以,指针函数理解为返回指针类型的函数;相应地,函数指针理解为指向函数的指针。

1.指针函数

前面说到,指针函数本质上是函数,其返回值是指针类型,如下:

ret* func(args, ...);

其中,func是一个函数,args是形参列表,ret*作为一个整体,是func函数的返回值,是一个指针的形式。

此处不再做过多赘述,但值得注意的是,对于指针函数,在函数体内最终的返回值,一定是存放在堆中、跟随程序运行生命周期的静态变量或全局变量,因为若返回值是存放在栈中的局部变量,局部变量随时被系统回收,指针指向这个变量的内存地址随时被更改而导致不可预料的问题

2.函数指针

2.1 定义

  • 每一个函数都占用一段内存单元,它们有一个起始地址,指向函数入口地址的指针称为函数指针。

2.2 语法

  • 指向函数的指针变量的一般定义形式为:数据类型 (*指针变量名)(参数表);

2.3 说明

  • 函数指针的定义形式中的数据类型是指函数的返回值的类型
  • 区分以下两个语句:
    int (p)(int a, int b); //p是一个指向函数的指针变量,所指函数的返回值类型为整型
    int
    p(int a, int b); //p是函数名,此函数的返回值类型为整型指针
  • 指向函数的指针变量不是固定指向哪一个函数的,而只是表示定义了一个这样类型的变量,它是专门用来存放函数的入口地址的;在程序中把哪一个函数的地址赋给它,它就指向哪一个函数。
  • 在给函数指针变量赋值时,只需给出函数名,而不必给出参数。
    如函数max的原型为:int max(int x, int y);
    指针p的定义为:int (*p)(int a, int b);
    则p = max;的作用是将函数max的入口地址赋给指针变量p。这时,p就是指向函数max的指针变量,也就是p和max都指向函数的开头。
  • 在一个程序中,指针变量p可以先后指向不同的函数,但一个函数不能赋给一个不一致的函数指针(即不能让一个函数指针指向与其类型不一致的函数)。
    如有如下的函数:int fn1(int x, int y); int fn2(int x);
    定义如下的函数指针:int (p1)(int a, int b); int (p2)(int a);

    p1 = fn1; //正确
    p2 = fn2; //正确
    p1 = fn2; //产生编译错误
  • 定义了一个函数指针并让它指向了一个函数后,对函数的调用可以通过函数名调用,也可以通过函数指针调用(即用指向函数的指针变量调用)。如语句:c = (*p)(a, b);//表示调用由p指向的函数(max),实参为a,b,函数调用结束后得到的函数值赋给c。
  • 函数指针只能指向函数的入口处,而不可能指向函数中间的某一条指令。不能用*(p+1)来表示函数的下一条指令。
  • 函数指针变量常用的用途之一是把指针作为参数传递到其他函数

2.4 举例

源代码:

#include <iostream>
using namespace std;
#include <conio.h>

int max(int x, int y); //求最大数
int min(int x, int y); //求最小数
int add(int x, int y); //求和
void process(int i, int j, int (*p)(int a, int b)); //应用函数指针

int main()
{
    int x, y;
    cin>>x>>y;

    cout<<"Max is: ";
    process(x, y, max);

    cout<<"Min is: ";
    process(x, y, min);

    cout<<"Add is: ";
    process(x, y, add);

    getch();
    return 0;
}

int max(int x, int y)
{
    return x > y ? x : y;
}

int min(int x, int y)
{
    return x > y ? y : x;
}

int add(int x, int y)
{
    return x + y;
}

void process(int i, int j, int (*p)(int a, int b))
{
    cout<<p(i, j)<<endl;
}

输出结果:

3 6
Max is: 6
Min is: 3
Add is: 9

二、函数指针应用实例-回调

1.什么是回调函数

我们绕点远路来回答这个问题。

编程分为两类:系统编程(system programming)和应用编程(application programming)。所谓系统编程,简单来说,就是编写;而应用编程就是利用写好的各种库来编写具某种功用的程序,也就是应用。系统程序员会给自己写的库留下一些接口,即API(application programming interface,应用编程接口),以供应用程序员使用。所以在抽象层的图示里,库位于应用的底下。

当程序跑起来时,一般情况下,应用程序(application program)会时常通过API调用库里所预先备好的函数。但是有些库函数(library function)却要求应用先传给它一个函数,好在合适的时候调用,以完成目标任务。这个被传入的、后又被调用的函数就称为回调函数(callback function)。

打个比方,有一家旅馆提供叫醒服务,但是要求旅客自己决定叫醒的方法。可以是打客房电话,也可以是派服务员去敲门,睡得死怕耽误事的,还可以要求往自己头上浇盆水。这里,“叫醒”这个行为是旅馆提供的,相当于库函数,但是叫醒的方式是由旅客决定并告诉旅馆的,也就是回调函数。而旅客告诉旅馆怎么叫醒自己的动作,也就是把回调函数传入库函数的动作,称为登记回调函数(to register a callback function)。如下图所示(图片来源:维基百科):

可以看到,回调函数通常和应用处于同一抽象层(因为传入什么样的回调函数是在应用级别决定的)。而回调就成了一个高层调用底层,底层再过头来用高层的过程。(我认为)这应该是回调最早的应用之处,也是其得名如此的原因。

2.回调机制的优势

从上面的例子可以看出,回调机制提供了非常大的灵活性。请注意,从现在开始,我们把图中的库函数改称为中间函数了,这是因为回调并不仅仅用在应用和库之间。任何时候,只要想获得类似于上面情况的灵活性,都可以利用回调。

这种灵活性是怎么实现的呢?乍看起来,回调似乎只是函数间的调用,但仔细一琢磨,可以发现两者之间的一个关键的不同:在回调中,我们利用某种方式,把回调函数像参数一样传入中间函数。可以这么理解,在传入一个回调函数之前,中间函数是不完整的。换句话说,程序可以在运行时,通过登记不同的回调函数,来决定、改变中间函数的行为。这就比简单的函数调用要灵活太多了。请看下面这段Python写成的回调的简单示例:

even.py

#回调函数1
#生成一个2k形式的偶数
def double(x):
    return x * 2

#回调函数2
#生成一个4k形式的偶数
def quadruple(x):
    return x * 4

callback_demo.py

from even import *

#中间函数
#接受一个生成偶数的函数作为参数
#返回一个奇数
def getOddNumber(k, getEvenNumber):
    return 1 + getEvenNumber(k)

#起始函数,这里是程序的主函数
def main():    
    k = 1
    #当需要生成一个2k+1形式的奇数时
    i = getOddNumber(k, double)
    print(i)
    #当需要一个4k+1形式的奇数时
    i = getOddNumber(k, quadruple)
    print(i)
    #当需要一个8k+1形式的奇数时
    i = getOddNumber(k, lambda x: x * 8)
    print(i)

if __name__ == "__main__":
    main()

运行callback_demp.py,输出如下:

3
5
9

上面的代码里,给getOddNumber传入不同的回调函数,它的表现也不同,这就是回调机制的优势所在。值得一提的是,上面的第三个回调函数是一个匿名函数。

3.易被忽略的第三方

通过上面的论述可知,中间函数和回调函数是回调的两个必要部分,不过人们往往忽略了回调里的第三位要角,就是中间函数的调用者。绝大多数情况下,这个调用者可以和程序的主函数等同起来,但为了表示区别,我这里把它称为起始函数(如上面的代码中注释所示)。

之所以特意强调这个第三方,是因为我在网上读相关文章时得到一种印象,很多人把它简单地理解为两个个体之间的来回调用。譬如,很多中文网页在解释“回调”(callback)时,都会提到这么一句话:“If you call me, I will call you back.”我没有查到这句英文的出处。我个人揣测,很多人把起始函数和回调函数看作为一体,大概有两个原因:第一,可能是“回调”这一名字的误导;第二,给中间函数传入什么样的回调函数,是在起始函数里决定的。实际上,回调并不是“你我”两方的互动,而是ABC的三方联动。有了这个清楚的概念,在自己的代码里实现回调时才不容易混淆出错。

这里再做总结,对应实例中:
起始函数:main()
中间函数:getOddNumber(k, getEvenNumber)
回调函数:double(x)quadruple(x)lambda x: x * 8

另外,回调实际上有两种:阻塞式回调延迟式回调。两者的区别在于:阻塞式回调里,回调函数的调用一定发生在起始函数返回之前;而延迟式回调里,回调函数的调用有可能是在起始函数返回之后。这里不打算对这两个概率做更深入的讨论,之所以把它们提出来,也是为了说明强调起始函数的重要性。网上的很多文章,提到这两个概念时,只是笼统地说阻塞式回调发生在主调函数返回之前,却没有明确这个主调函数到底是起始函数还是中间函数,不免让人糊涂,所以这里特意说明一下。另外还请注意,本文中所举的示例均为阻塞式回调。延迟式回调通常牵扯到多线程,我自己还没有完全搞明白,所以这里就不多说了。