“钩”一词是什么意思?在编程吗?

我最近在和一些人谈论我正在编写的程序时听到了“hook”这个词。我不确定这个术语到底意味着什么,尽管我从对话中推断钩子是一种函数类型。我寻找一个定义,但无法找到一个好的答案。有没有人能告诉我这个术语的一般含义,或者举个小例子来说明这个定义?

145908 次浏览

从本质上讲,它是代码中的一个地方,允许您进入一个模块来提供不同的行为或在发生某事时做出反应。

编程中的连接是一种技术,它使用所谓的钩子来创建一个过程链作为事件处理程序。

当遇到某些条件时,可以执行钩子。例如,一些变量发生了变化,或者调用了一些动作,或者发生了一些事件。hook可以进入过程并更改内容或对更改作出反应。

通常,钩子是指Win32消息钩子或Linux/OSX的等等物,但更一般地,钩子只是通知另一个对象/窗口/程序/等,当指定的操作发生时,你想被通知。例如:让系统上的所有窗口在即将关闭时通知您。

作为一般规则,钩子有点危险,因为在不了解它如何影响系统的情况下这样做可能会导致不稳定或至少是意想不到的行为。在某些情况下,它也非常有用。例如:游戏录象软件使用它来确定应该在哪个窗口显示它的FPS计数器。

钩子是软件为用户提供的功能,在特定情况下调用他们自己的代码。该代码可以增加或替换当前代码。

在电脑真正属于个人的时代,病毒还不那么流行(我说的是80年代),它就像打补丁操作系统软件本身来调用你的代码一样简单。我记得我在Apple II上写了一个Applesoft BASIC语言的扩展,它在任何一行被处理之前,通过向我的代码注入一个调用,简单地将我的代码连接到BASIC解释器中。

一些计算机预先设计了钩子,苹果II上的I/O流就是一个例子。它使用这样一个钩子注入整个磁盘子系统(Apple II rom最初是在盒式磁带是个人电脑主要存储介质的年代制造的)。你通过印刷 ASCII码4 (CTRL-D)来控制磁盘,接着是你想要执行的命令,然后是CR,它被磁盘子系统拦截,它已经把自己钩到苹果ROM打印例程中。

例如,这几行:

PRINT CHR(4);"CATALOG"
PRINT CHR(4);"IN#6"

会列出磁盘内容,然后重新初始化计算机。这样就可以通过设置第一行来保护你的BASIC程序:

123 REM XIN#6

然后使用POKEX所在的位置插入CTRL-D字符。然后,任何试图列出源代码的人都会通过磁盘子系统检测到的输出例程发送重新初始化序列。

这通常是我们为了得到我们想要的行为而不得不采取的手段。

现在,由于操作系统更加安全,它为钩子本身提供了便利,因为您不再需要“在运行中”或在磁盘上修改操作系统。

它们已经存在了一段时间。大型机有这些功能(称为出口),甚至现在还有大量的大型机软件使用这些功能。例如,z/OS附带的免费源代码控制系统(称为SCLM)允许您通过在出口中放置自己的代码来完全替换安全子系统。

在一般意义上,“钩子”是让程序员查看和/或与/或改变系统/程序中已经发生的事情的东西。

例如,Drupal CMS为开发人员提供了钩子,允许他们在创建“内容节点”之后采取额外的操作。如果开发人员没有实现钩子,则按常规创建节点。如果开发人员实现了钩子,他们可以在创建节点时运行一些额外的代码。这段代码可以做任何事情,包括回滚和/或更改原始操作。它还可以做一些与节点创建完全无关的事情。

回调可以被认为是一种特定类型的钩子。通过在系统中实现回调功能,该系统允许您在操作完成后调用一些额外的代码。然而,钩子(作为一个通用术语)并不局限于回调。

另一个例子。有时Web开发人员会将元素上的类名和/或id称为钩子。这是因为通过在元素上放置ID/类名,他们可以使用Javascript修改该元素,或“钩入”到页面文档。(这是一个延伸的意思,但它是常用的,值得一提)

钩子链是一组函数,其中每个函数都调用下一个函数。钩子链的重要之处在于,程序员可以在运行时向钩子链中添加另一个函数。做到这一点的一种方法是寻找一个已知的位置,其中保存链中第一个函数的地址。然后保存该函数指针的值,并用希望插入到钩子链中的函数的地址覆盖初始地址处的值。然后函数被调用,执行它的业务并调用链中的下一个函数(除非您另有决定)。当然,还有许多其他方法可以创建钩子链,从直接写入内存到使用Ruby或Python等语言的元编程功能。

钩子链的一个例子是MS Windows应用程序处理消息的方式。处理链中的每个函数要么处理消息,要么将其发送给链中的下一个函数。

在Drupal内容管理系统中,“hook”有一个相对特定的含义。当内部事件发生时(例如内容创建或用户登录),模块可以通过实现一个特殊的“钩子”函数来响应该事件。这是通过命名约定完成的——例如,用户登录事件的[your-plugin-name]_user_login()。

由于这种惯例,底层事件被称为“钩子”,并在Drupal的API文档中以“hook_user_login”和“hook_user_authenticate()”这样的名称出现。

简而言之,你可以改变API调用的代码,比如MessageBox,让它执行由你编辑的不同函数(全局适用于系统范围,局部适用于进程范围)。

Hook表示在代码中分派某个类型的事件的位置,如果该事件在此之前已使用适当的函数进行回调,那么它将由这个已注册的函数处理,否则什么都不会发生。

钩子是一类允许基本代码调用扩展代码的函数。这在核心开发人员希望在不暴露代码的情况下提供可扩展性的情况下非常有用。

钩子的一个用法是在电子游戏mod开发中。游戏可能不允许mod开发者扩展基本功能,但核心mod库开发者可以添加钩子。有了这些钩子,独立开发者可以在任何想要的事件中调用他们的自定义代码,比如游戏加载、库存更新、实体交互等。

一种常见的实现方法是给函数一个空的回调列表,然后公开扩展回调列表的能力。基本代码将始终在相同的适当时间调用该函数,但如果是空回调列表,则该函数不执行任何操作。这是有意为之。

然后,第三方就有机会编写额外的代码,并将他们的新回调添加到钩子的回调列表中。仅仅通过一个可用钩子的引用,它们就以最小的风险扩展了基本系统的功能。

hook不允许开发人员做任何其他结构和接口不能做的事情。它们是需要考虑任务和用户(第三方开发人员)的选择。

澄清一下:钩子允许扩展,并且可以使用回调来实现。回调函数通常只是一个函数指针;函数的计算地址。其他答案/评论似乎有些混乱。

简单的说:

钩子是在现有代码之前、之后或代替现有代码执行自定义代码(函数)的一种方法。例如,为了在继续正常登录过程之前执行验证码函数,可以编写一个函数“hook”到登录过程中。

答案很多,但没有例子,所以添加一个虚拟的:下面的complicated_func提供了两个钩子来修改它的行为

from typing import List, Callable




def complicated_func(
lst: List[int], hook_modify_element: Callable[[int], int], hook_if_negative=None
) -> int:
res = sum(hook_modify_element(x) for x in lst)
if res < 0 and hook_if_negative is not None:
print("Returning negative hook")
return hook_if_negative
return res




def my_hook_func(x: int) -> int:
return x * 2




if __name__ == "__main__":
res = complicated_func(
lst=[1, 2, -10, 4],
hook_modify_element=my_hook_func,
hook_if_negative=0,
)
print(res)

一个函数,允许您提供另一个函数,而不仅仅是一个值作为参数,本质上是扩展它。