GHC中自动特化的传递性

来自GHC 7.6的的文档:

你通常一开始就不需要使用specialized语法。当编译模块M时,GHC的优化器(带-O)会自动考虑在M中声明的每个顶级重载函数,并针对在M中被调用的不同类型对其进行特殊化。优化器还会考虑每个导入的INLINABLE重载函数,并针对在M中被调用的不同类型对其进行特殊化。

而且

此外,给定函数f的specialspecialpragma, GHC将自动为f调用的任何类型类重载函数创建专门化,如果它们与specialspecialpragma在同一个模块中,或者如果它们是INLINABLE;以此类推。

所以GHC应该自动专门化一些/最/ (?)函数标记INLINABLE 没有一个pragma,如果我使用显式的pragma,专门化是可传递的。我的问题是: __abc0 -特化是否可传递?< / p >

具体来说,这里有一个小例子:

Main.hs:

import Data.Vector.Unboxed as U
import Foo


main =
let y = Bar $ Qux $ U.replicate 11221184 0 :: Foo (Qux Int)
(Bar (Qux ans)) = iterate (plus y) y !! 100
in putStr $ show $ foldl1' (*) ans

foo。:

module Foo (Qux(..), Foo(..), plus) where


import Data.Vector.Unboxed as U


newtype Qux r = Qux (Vector r)
-- GHC inlines `plus` if I remove the bangs or the Baz constructor
data Foo t = Bar !t
| Baz !t


instance (Num r, Unbox r) => Num (Qux r) where
{-# INLINABLE (+) #-}
(Qux x) + (Qux y) = Qux $ U.zipWith (+) x y


{-# INLINABLE plus #-}
plus :: (Num t) => (Foo t) -> (Foo t) -> (Foo t)
plus (Bar v1) (Bar v2) = Bar $ v1 + v2

GHC专门调用plus,但是专门调用Qux Num实例中的(+),这会降低性能。

然而,一个显式的pragma

{-# SPECIALIZE plus :: Foo (Qux Int) -> Foo (Qux Int) -> Foo (Qux Int) #-}

如文档所示,结果是传递专门化,因此(+)是专门化的,代码速度快了30倍(都是用-O2编译的)。这是预期的行为吗?我应该只期望(+)通过显式的pragma传递地特殊化吗?


更新

7.8.2的文档没有改变,行为是一样的,所以这个问题仍然是相关的。

21909 次浏览

简短的答案:

就我的理解,这个问题的重点是:

  • "自动专门化是可传递的吗"
  • 我应该只期望(+)通过显式的pragma传递地特殊化吗?
  • (显然是故意的)这是GHC的错误吗?是否与文档不一致?

AFAIK,答案是否定的,大部分是肯定的,但也有其他方法,也有否定的。

代码内联和类型应用程序专门化是速度(执行时间)和代码大小之间的权衡。默认级别可以在不膨胀代码的情况下获得一些加速。选择一个更详尽的级别留给程序员通过SPECIALISE pragma判断。

解释:

优化器还考虑每个导入的INLINABLE重载函数,并针对在M中调用它的不同类型将其特殊化。

假设f是一个函数,其类型包括类型变量a,受类型类C a约束。如果(a)同一模块中的任何函数在源代码中调用f,或者(b)如果f被标记为INLINABLE,则任何其他从a0中a3 f的模块,GHC默认专化了f类型应用程序(用a代替t)。因此,自动专门化是不可传递的,它只涉及a2的a4中导入和调用的INLINABLE函数。

在你的例子中,如果你重写Num实例,如下所示:

instance (Num r, Unbox r) => Num (Qux r) where
(+) = quxAdd


quxAdd (Qux x) (Qux y) = Qux $ U.zipWith (+) x y
  • quxAdd不是由Main特别导入的。Main导入Num (Qux Int)的实例字典,该字典在(+)的记录中包含quxAdd。但是,虽然导入了字典,但字典中使用的内容没有导入。
  • plus不调用quxAdd,它使用Num t实例字典中为(+)记录存储的函数。该字典由编译器在调用位置(Main)设置。